Spesifikasi ALELEON Supercomputer: Perbedaan antara revisi
Dari ALELEON by EFISON
WilsonLisan (bicara | kontrib) (Major writing spek hardware, software, dan EFIRO) |
WilsonLisan (bicara | kontrib) (→Spesifikasi Interactive Node GPU (Partisi tilla): paraphrasing) |
||
(13 revisi perantara oleh pengguna yang sama tidak ditampilkan) | |||
Baris 1: | Baris 1: | ||
ALELEON Supercomputer saat ini menggunakan '''HPC ALELEON Mk. | ALELEON Supercomputer saat ini menggunakan '''HPC ALELEON Mk.III''' - superkomputer ''custom'' EFISON generasi ketiga '''yang akan beroperasi pada November 2022''' untuk menjalankan arsitektur EFIRO. | ||
== '''Spesifikasi Hardware''' == | == '''Spesifikasi Hardware''' == | ||
Terdapat 3 jenis node: | |||
* Login Node -> tempat user login ke ALELEON Supercomputer. Tidak untuk menjalankan komputasi berat | |||
* Compute Node -> Node untuk menjalankan job komputasi user via SLURM dari Login Node. | |||
* Interactive Node -> Node untuk menjalankan sesi interaktif via EFIRO seperti ALELEON Desktop atau Jupyter Lab. | |||
=== Spesifikasi Compute Node CPU (Partisi epyc) === | |||
{| class="wikitable" | {| class="wikitable" | ||
| | |Nodes | ||
|3 | |||
* epyc001 -> high memory | |||
* epyc[002-003] -> normal | |||
|- | |- | ||
| | |Prosesor per node | ||
|1x AMD EPYC 7702P, 64 core / 128 thread, 2.0Ghz | |||
|AMD EPYC 7702P 64 | |||
|- | |- | ||
|Compute Node GPU | |RAM per node | ||
| | | | ||
| | * high memory -> 500GB efektif | ||
* normal -> 240GB efektif | |||
| | |- | ||
|Interkoneksi | |||
|Mellanox RoCE 100Gbps | |||
|} | |||
=== Spesifikasi Compute Node GPU (Partisi gpu_ampere) === | |||
{| class="wikitable" | |||
|Nodes | |||
|1 | |||
|- | |- | ||
| | |Prosesor | ||
| | |AMD Threadripper 3955WX, 16 core / 32 thread, 3.9Ghz | ||
|- | |- | ||
| | |RAM | ||
| | |128GB | ||
|- | |- | ||
| | |GPU | ||
| | |2x NVIDIA RTX 3090 24GB NVLink | ||
|- | |- | ||
| | |Interkoneksi | ||
| | |Mellanox RoCE 25Gbps | ||
|} | |} | ||
== | === Spesifikasi Interactive Node CPU (Partisi torti) === | ||
{| class="wikitable" | {| class="wikitable" | ||
| | |Nodes | ||
|2 | |||
|- | |- | ||
| | |Prosesor per node | ||
| | |AMD Threadripper 3990X, 32 v-core, 2.9Ghz | ||
|- | |- | ||
| | |RAM per node | ||
| | |64GB | ||
|} | |||
=== Spesifikasi Interactive Node GPU (Partisi tilla) === | |||
{| class="wikitable" | |||
|Nodes | |||
|2 | |||
|- | |- | ||
| | |Prosesor per node | ||
| | |AMD Threadripper 3990X, 32 v-core, 2.9Ghz | ||
|- | |- | ||
| | |RAM per node | ||
| | |64GB | ||
|- | |- | ||
| | |GPU per node | ||
| | |1x NVIDIA RTX 3090 24GB | ||
| | |} | ||
| | |||
=== Spesifikasi Storage === | |||
{| class="wikitable" | |||
|Jenis storage | |||
|Block-storage, protokol NFS | |||
|- | |- | ||
| | |HOME and workdir | ||
| | |HDD SAS 83TiB efektif | ||
|- | |- | ||
| | |SCRATCH caching | ||
| | |SSD 1TB NVMe 4.0 | ||
|- | |- | ||
| | |Interkoneksi | ||
| | |Mellanox RoCE 100Gbps | ||
|} | |} | ||
{{DISPLAYTITLE:Spesifikasi ALELEON Supercomputer}} | |||
__TOC__ | |||
Sistem melakukan checkpoint snapshot storage per 24 jam. User dapat melayangkan permintaan ke email support untuk recovery data apabila tidak sengaja menghapus data. | |||
== '''Spesifikasi Software''' == | |||
* '''Sistem Operasi''' | |||
** Rocky Linux 8 | |||
* '''Autentikasi Login''' | |||
** OpenVPN dan PAM | |||
* '''GCC default OS''' | |||
** GNU RHEL 8.5 | |||
* '''Manajemen Job''' | |||
** SLURM 20.11.5 dengan protokol PMIX, UCX, CUDA, dan auto load-balancing menyesuaikan arsitektur AMD Zen2. | |||
* '''Modul instalasi dan software untuk user''' | |||
** EasyBuild 4.4.2 | |||
** Lmod 8.1.18 | |||
* '''Profiler''' | |||
** AMD μProf | |||
* '''Katalog lengkap software compilers, libs, framework:''' | |||
** '''[[Katalog Software ALELEON Supercomputer]]''' | |||
__TANPADAFTARISI__ |
Revisi per 30 November 2022 09.15
ALELEON Supercomputer saat ini menggunakan HPC ALELEON Mk.III - superkomputer custom EFISON generasi ketiga yang akan beroperasi pada November 2022 untuk menjalankan arsitektur EFIRO.
Spesifikasi Hardware
Terdapat 3 jenis node:
- Login Node -> tempat user login ke ALELEON Supercomputer. Tidak untuk menjalankan komputasi berat
- Compute Node -> Node untuk menjalankan job komputasi user via SLURM dari Login Node.
- Interactive Node -> Node untuk menjalankan sesi interaktif via EFIRO seperti ALELEON Desktop atau Jupyter Lab.
Spesifikasi Compute Node CPU (Partisi epyc)
Nodes | 3
|
Prosesor per node | 1x AMD EPYC 7702P, 64 core / 128 thread, 2.0Ghz |
RAM per node |
|
Interkoneksi | Mellanox RoCE 100Gbps |
Spesifikasi Compute Node GPU (Partisi gpu_ampere)
Nodes | 1 |
Prosesor | AMD Threadripper 3955WX, 16 core / 32 thread, 3.9Ghz |
RAM | 128GB |
GPU | 2x NVIDIA RTX 3090 24GB NVLink |
Interkoneksi | Mellanox RoCE 25Gbps |
Spesifikasi Interactive Node CPU (Partisi torti)
Nodes | 2 |
Prosesor per node | AMD Threadripper 3990X, 32 v-core, 2.9Ghz |
RAM per node | 64GB |
Spesifikasi Interactive Node GPU (Partisi tilla)
Nodes | 2 |
Prosesor per node | AMD Threadripper 3990X, 32 v-core, 2.9Ghz |
RAM per node | 64GB |
GPU per node | 1x NVIDIA RTX 3090 24GB |
Spesifikasi Storage
Jenis storage | Block-storage, protokol NFS |
HOME and workdir | HDD SAS 83TiB efektif |
SCRATCH caching | SSD 1TB NVMe 4.0 |
Interkoneksi | Mellanox RoCE 100Gbps |
Sistem melakukan checkpoint snapshot storage per 24 jam. User dapat melayangkan permintaan ke email support untuk recovery data apabila tidak sengaja menghapus data.
Spesifikasi Software
- Sistem Operasi
- Rocky Linux 8
- Autentikasi Login
- OpenVPN dan PAM
- GCC default OS
- GNU RHEL 8.5
- Manajemen Job
- SLURM 20.11.5 dengan protokol PMIX, UCX, CUDA, dan auto load-balancing menyesuaikan arsitektur AMD Zen2.
- Modul instalasi dan software untuk user
- EasyBuild 4.4.2
- Lmod 8.1.18
- Profiler
- AMD μProf
- Katalog lengkap software compilers, libs, framework: