Spesifikasi ALELEON Supercomputer
Dari ALELEON by EFISON
Revisi sejak 14 Februari 2023 09.54 oleh WilsonLisan (bicara | kontrib) (→Spesifikasi Software Sistem: menambah info open ondemand)
ALELEON Supercomputer saat ini menggunakan HPC ALELEON Mk.III - superkomputer custom EFISON generasi ketiga menyesuaikan arsitektur EFIRO.
Spesifikasi Hardware
Terdapat 3 jenis node:
- Login Node -> tempat user login ke ALELEON Supercomputer. Tidak untuk menjalankan komputasi berat
- Compute Node -> Node untuk menjalankan job komputasi user via SLURM dari Login Node.
- Interactive Node -> Node untuk menjalankan sesi interaktif via EFIRO seperti ALELEON Desktop atau Jupyter Lab / Notebook.
Spesifikasi Compute Node CPU (Partisi epyc)
Nodes | 3
|
CPU per node | 1x AMD EPYC 7702P, 64 core / 128 thread, 2.0Ghz |
RAM per node |
|
Interkoneksi | Mellanox RoCE 100Gbps |
Spesifikasi Compute Node GPU (Partisi gpu_ampere)
Nodes | 1 |
CPU | AMD Threadripper 3955WX, 16 core / 32 thread, 3.9Ghz |
RAM | 128GB |
GPU | 2x NVIDIA RTX 3090 24GB NVLink |
Interkoneksi | Mellanox RoCE 25Gbps |
Spesifikasi Interactive Node CPU (Partisi torti)
Nodes | 2 |
CPU per node | AMD Threadripper 3990X, 32 v-core, 2.9Ghz |
RAM per node | 64GB |
Spesifikasi Interactive Node GPU (Partisi tilla)
Nodes | 2 |
CPU per node | AMD Threadripper 3990X, 32 v-core, 2.9Ghz |
RAM per node | 64GB |
GPU per node | 1x NVIDIA RTX 3090 24GB |
Spesifikasi Storage
Jenis storage | Block-storage, protokol NFS |
HOME and workdir | HDD SAS 83TiB efektif |
SCRATCH caching | SSD 1TB NVMe 4.0 |
Interkoneksi | Mellanox RoCE 100Gbps |
Sistem melakukan checkpoint snapshot storage per 24 jam. User dapat melayangkan permintaan ke email support untuk recovery data apabila tidak sengaja menghapus data.
Spesifikasi Software Sistem
- Sistem Operasi
- Rocky Linux 8 dengan Kernel 4.18.0-425.3.1.el8.x86_64
- Autentikasi Login
- OpenVPN dan PAM
- EFIRO Web Service untuk login web dengan tampilan grafis (GUI)
- Berbasiskan Open OnDemand dengan modifikasi menyesuaikan penggunaan spesifik ALELEON Supercomputer
- Menggunakan interactive package Jupyter Notebook, Jupyter Lab, dan Virtual Desktop Session (ALELEON Desktop)
- Lisensi MIT
- Manajemen Job (job scheduler)
- SLURM 20.11.9 dengan protokol PMIX, UCX, CUDA, dan auto load-balancing menyesuaikan arsitektur AMD Zen 2.
- Manajemen modul software (module environment)
- Lmod 8.1.18
- Manajemen instalasi software (package manager)
- EasyBuild 4.7.0
- Conda (melalui module environment Anaconda 3 suite)
- Spack 0.17.2 (melalui module environment)
- Manajemen compiling otomatis
- GNU Make 4.2.1
- CMake 3.24.3 (melalui module environment)
- Profiler sistem
- CPU -> AMD μProf
- Provisioning sistem
- WareWulf 4.0
- Library I/O sistem
- HDF5 1.12.1 (melalui module environment)
- NetCDF 4.8.1 (melalui module environment)
- Dukungan compiler dan interpreter default OS:
- GCC Red Hat 8.5.0-15
- Python 3.9.13
- Perl 5.26.5
- Katalog lengkap software compiler, library, dan framework untuk penggunaan global