Spesifikasi ALELEON Supercomputer: Perbedaan antara revisi
Dari ALELEON by EFISON
WilsonLisan (bicara | kontrib) (→Spesifikasi Hardware: Compute Node: reformat) |
WilsonLisan (bicara | kontrib) (→Spesifikasi Interactive Node GPU (Partisi tilla): paraphrasing) |
||
(9 revisi perantara oleh pengguna yang sama tidak ditampilkan) | |||
Baris 1: | Baris 1: | ||
ALELEON Supercomputer saat ini menggunakan '''HPC ALELEON Mk.III''' - superkomputer ''custom'' EFISON generasi ketiga '''yang akan beroperasi pada | ALELEON Supercomputer saat ini menggunakan '''HPC ALELEON Mk.III''' - superkomputer ''custom'' EFISON generasi ketiga '''yang akan beroperasi pada November 2022''' untuk menjalankan arsitektur EFIRO. | ||
== '''Spesifikasi Hardware | == '''Spesifikasi Hardware''' == | ||
Terdapat 3 jenis node: | |||
* Login Node -> tempat user login ke ALELEON Supercomputer. Tidak untuk menjalankan komputasi berat | |||
* Compute Node -> Node untuk menjalankan job komputasi user via SLURM dari Login Node. | |||
* Interactive Node -> Node untuk menjalankan sesi interaktif via EFIRO seperti ALELEON Desktop atau Jupyter Lab. | |||
=== Spesifikasi Compute Node CPU (Partisi epyc) === | |||
{| class="wikitable" | {| class="wikitable" | ||
|Nodes | |||
|3 | |||
* epyc001 -> high memory | |||
* epyc[002-003] -> normal | |||
|- | |||
|Prosesor per node | |||
|1x AMD EPYC 7702P, 64 core / 128 thread, 2.0Ghz | |||
|- | |||
|RAM per node | |||
| | | | ||
=== | * high memory -> 500GB efektif | ||
* normal -> 240GB efektif | |||
|- | |||
|Interkoneksi | |||
|Mellanox RoCE 100Gbps | |||
|} | |||
=== Spesifikasi Compute Node GPU (Partisi gpu_ampere) === | |||
{| class="wikitable" | |||
|Nodes | |||
|1 | |||
|- | |||
|Prosesor | |||
|AMD Threadripper 3955WX, 16 core / 32 thread, 3.9Ghz | |||
|- | |- | ||
| | |RAM | ||
|128GB | |||
|- | |||
|GPU | |||
|2x NVIDIA RTX 3090 24GB NVLink | |||
|- | |||
|Interkoneksi | |||
|Mellanox RoCE 25Gbps | |||
|} | |} | ||
== | === Spesifikasi Interactive Node CPU (Partisi torti) === | ||
{| class="wikitable" | {| class="wikitable" | ||
| | |Nodes | ||
|2 | |||
|- | |||
|Prosesor per node | |||
|AMD Threadripper 3990X, 32 v-core, 2.9Ghz | |||
|- | |- | ||
| | |RAM per node | ||
|64GB | |||
|} | |} | ||
== | === Spesifikasi Interactive Node GPU (Partisi tilla) === | ||
{| class="wikitable" | |||
|Nodes | |||
|2 | |||
|- | |||
|Prosesor per node | |||
|AMD Threadripper 3990X, 32 v-core, 2.9Ghz | |||
|- | |||
|RAM per node | |||
|64GB | |||
|- | |||
|GPU per node | |||
|1x NVIDIA RTX 3090 24GB | |||
|} | |||
=== Spesifikasi Storage === | |||
{| class="wikitable" | |||
|Jenis storage | |||
|Block-storage, protokol NFS | |||
|- | |||
|HOME and workdir | |||
|HDD SAS 83TiB efektif | |||
|- | |||
|SCRATCH caching | |||
|SSD 1TB NVMe 4.0 | |||
|- | |||
|Interkoneksi | |||
|Mellanox RoCE 100Gbps | |||
|} | |||
{{DISPLAYTITLE:Spesifikasi ALELEON Supercomputer}} | {{DISPLAYTITLE:Spesifikasi ALELEON Supercomputer}} | ||
__TOC__ | __TOC__ | ||
== '''Spesifikasi | |||
Sistem melakukan checkpoint snapshot storage per 24 jam. User dapat melayangkan permintaan ke email support untuk recovery data apabila tidak sengaja menghapus data. | |||
== '''Spesifikasi Software''' == | |||
* '''Sistem Operasi''' | * '''Sistem Operasi''' | ||
** Linux | ** Rocky Linux 8 | ||
* '''Autentikasi Login''' | * '''Autentikasi Login''' | ||
** OpenVPN dan PAM | ** OpenVPN dan PAM | ||
* '''GCC default OS''' | * '''GCC default OS''' | ||
** GNU RHEL | ** GNU RHEL 8.5 | ||
* '''Manajemen Job''' | * '''Manajemen Job''' | ||
** SLURM 20.11.5 dengan protokol PMIX, UCX, CUDA, dan auto load-balancing menyesuaikan arsitektur AMD Zen2. | ** SLURM 20.11.5 dengan protokol PMIX, UCX, CUDA, dan auto load-balancing menyesuaikan arsitektur AMD Zen2. | ||
* '''Modul instalasi dan software untuk user''' | * '''Modul instalasi dan software untuk user''' | ||
** EasyBuild 4.4.2 | ** EasyBuild 4.4.2 | ||
** Lmod 8.1.18 | ** Lmod 8.1.18 | ||
* '''Katalog lengkap software''' | * '''Profiler''' | ||
** AMD μProf | |||
* '''Katalog lengkap software compilers, libs, framework:''' | |||
** '''[[Katalog Software ALELEON Supercomputer]]''' | ** '''[[Katalog Software ALELEON Supercomputer]]''' | ||
__TANPADAFTARISI__ | __TANPADAFTARISI__ |
Revisi per 30 November 2022 09.15
ALELEON Supercomputer saat ini menggunakan HPC ALELEON Mk.III - superkomputer custom EFISON generasi ketiga yang akan beroperasi pada November 2022 untuk menjalankan arsitektur EFIRO.
Spesifikasi Hardware
Terdapat 3 jenis node:
- Login Node -> tempat user login ke ALELEON Supercomputer. Tidak untuk menjalankan komputasi berat
- Compute Node -> Node untuk menjalankan job komputasi user via SLURM dari Login Node.
- Interactive Node -> Node untuk menjalankan sesi interaktif via EFIRO seperti ALELEON Desktop atau Jupyter Lab.
Spesifikasi Compute Node CPU (Partisi epyc)
Nodes | 3
|
Prosesor per node | 1x AMD EPYC 7702P, 64 core / 128 thread, 2.0Ghz |
RAM per node |
|
Interkoneksi | Mellanox RoCE 100Gbps |
Spesifikasi Compute Node GPU (Partisi gpu_ampere)
Nodes | 1 |
Prosesor | AMD Threadripper 3955WX, 16 core / 32 thread, 3.9Ghz |
RAM | 128GB |
GPU | 2x NVIDIA RTX 3090 24GB NVLink |
Interkoneksi | Mellanox RoCE 25Gbps |
Spesifikasi Interactive Node CPU (Partisi torti)
Nodes | 2 |
Prosesor per node | AMD Threadripper 3990X, 32 v-core, 2.9Ghz |
RAM per node | 64GB |
Spesifikasi Interactive Node GPU (Partisi tilla)
Nodes | 2 |
Prosesor per node | AMD Threadripper 3990X, 32 v-core, 2.9Ghz |
RAM per node | 64GB |
GPU per node | 1x NVIDIA RTX 3090 24GB |
Spesifikasi Storage
Jenis storage | Block-storage, protokol NFS |
HOME and workdir | HDD SAS 83TiB efektif |
SCRATCH caching | SSD 1TB NVMe 4.0 |
Interkoneksi | Mellanox RoCE 100Gbps |
Sistem melakukan checkpoint snapshot storage per 24 jam. User dapat melayangkan permintaan ke email support untuk recovery data apabila tidak sengaja menghapus data.
Spesifikasi Software
- Sistem Operasi
- Rocky Linux 8
- Autentikasi Login
- OpenVPN dan PAM
- GCC default OS
- GNU RHEL 8.5
- Manajemen Job
- SLURM 20.11.5 dengan protokol PMIX, UCX, CUDA, dan auto load-balancing menyesuaikan arsitektur AMD Zen2.
- Modul instalasi dan software untuk user
- EasyBuild 4.4.2
- Lmod 8.1.18
- Profiler
- AMD μProf
- Katalog lengkap software compilers, libs, framework: