ALELEON Supercomputer saat ini menggunakan HPC ALELEON Mk.III - superkomputer custom EFISON generasi ketiga menyesuaikan arsitektur EFIRO.
Spesifikasi Hardware
Terdapat 3 jenis node:
- Login Node -> tempat user login ke ALELEON Supercomputer. Tidak untuk menjalankan komputasi berat
- Compute Node -> Node untuk menjalankan job komputasi user via SLURM dari Login Node.
- Interactive Node -> Node untuk menjalankan sesi interaktif via EFIRO seperti ALELEON Desktop atau Jupyter Lab / Notebook.
Spesifikasi Compute Node CPU (Partisi epyc)
Nodes
|
3
- epyc001 -> high memory
- epyc[002-003] -> normal
|
CPU per node
|
1x AMD EPYC 7702P, 64 core / 128 thread, 2.0Ghz
|
RAM per node
|
- high memory -> 500GB efektif
- normal -> 240GB efektif
|
Interkoneksi
|
Mellanox RoCE 100Gbps
|
Spesifikasi Compute Node GPU (Partisi gpu_ampere)
Nodes
|
1
|
CPU
|
AMD Threadripper 3955WX, 16 core / 32 thread, 3.9Ghz
|
RAM
|
128GB
|
GPU
|
2x NVIDIA RTX 3090 24GB NVLink
|
Interkoneksi
|
Mellanox RoCE 25Gbps
|
Spesifikasi Interactive Node CPU (Partisi torti)
Nodes
|
2
|
CPU per node
|
AMD Threadripper 3990X, 32 v-core, 2.9Ghz
|
RAM per node
|
64GB
|
Spesifikasi Interactive Node GPU (Partisi tilla)
Nodes
|
2
|
CPU per node
|
AMD Threadripper 3990X, 32 v-core, 2.9Ghz
|
RAM per node
|
64GB
|
GPU per node
|
1x NVIDIA RTX 3090 24GB
|
Spesifikasi Storage
Jenis storage
|
Block-storage, protokol NFS
|
HOME and workdir
|
HDD SAS 83TiB efektif
|
SCRATCH caching
|
SSD 1TB NVMe 4.0
|
Interkoneksi
|
Mellanox RoCE 100Gbps
|
Sistem melakukan checkpoint snapshot storage per 24 jam. User dapat melayangkan permintaan ke email support untuk recovery data apabila tidak sengaja menghapus data.
Spesifikasi Software
- Sistem Operasi
- Rocky Linux 8
- Kernel 4.18.0-425.3.1.el8.x86_64
- Autentikasi Login
- GCC default OS
- Manajemen Job
- SLURM 20.11.5 dengan protokol PMIX, UCX, CUDA, dan auto load-balancing menyesuaikan arsitektur AMD Zen2.
- Modul instalasi dan software untuk user
- EasyBuild 4.4.2
- Lmod 8.1.18
- Profiler
- Katalog lengkap software compilers, libs, framework: