Spesifikasi ALELEON Supercomputer: Perbedaan antara revisi

Dari ALELEON by EFISON
(merapikan format dan melengkapi spek coming soon)
Baris 1: Baris 1:
ALELEON Supercomputer saat ini menggunakan '''HPC ALELEON Mk.III''' - superkomputer ''custom'' EFISON generasi ketiga '''yang akan beroperasi pada April 2022''' untuk menjalankan arsitektur EFIRO.
32GB8ALELEON Supercomputer saat ini menggunakan '''HPC ALELEON Mk.III''' - superkomputer ''custom'' EFISON generasi ketiga '''yang akan beroperasi pada November 2022''' untuk menjalankan arsitektur EFIRO.


== '''Spesifikasi Hardware: Compute Node''' ==
== '''Spesifikasi Hardware''' ==
Compute Node adalah bagian bagian server komputasi ALELEON Supercomputer utama untuk menjalankan berbagai level komputasi dari kecil hingga besar.
Terdapat 3 jenis node:


* Komputasi berjalan di Compute Node apabila dibuat melalui [https://wiki.efisonlt.com/wiki/Tutorial_Menggunakan_ALELEON_Supercomputer#3B._Job_Composer_dan_Interactive_Apps '''Job Composer'''].
* '''Login Node:''' tempat user login ke ALELEON Supercomputer. Tidak untuk menjalankan komputasi berat
* Melalui [[SLURM Script ALELEON Supercomputer|'''Submit Script''']] (bagian dari Job Composer), user bebas dalam mengalokasikan jumlah resources job misalnya menggunakan 32 core CPU + RAM 64GB atau 96 core CPU + RAM 128GB, 16 core CPU + 2 GPU, dst.
* '''Compute Node:''' Node untuk menjalankan job komputasi user via SLURM dari Login Node.  
* '''Interactive Node:''' Node untuk menjalankan sesi interaktif via EFIRO seperti ALELEON Desktop atau Jupyter Lab.
 
=== Spesifikasi Login Node Utama ''(Coming Soon)'' ===
{| class="wikitable"
{| class="wikitable"
|
|Nodes
=== Partisi epyc / Compute Node CPU ===
|1
*'''Total CPU 192 cores / 384 threads, RAM 768GB'''
** Terdiri dari '''3 node''' dengan spesifikasi masing-masing:
*** CPU AMD EPYC 7702P 64 cores / 128 threads
*** RAM 256GB
|-
|-
|
|Prosesor
=== Partisi gpu_ampere / Compute Node GPU ===
|AMD EPYC 7313P, 16 v-core, 3.0Ghz
*'''1 Node'''
|-
** CPU AMD Threadripper Pro 3955WX 16 cores / 32 threads
|RAM
** GPU 3x NVIDIA RTX 3090 24GB
|64GB
** RAM 128GB
|-
|Interkoneksi
|Mellanox RoCE 25Gbps
|}
|}


== '''Spesifikasi Hardware: Interactive Node''' ==
=== Spesifikasi Login Node GPU dan backup ===
Interactive node adalah bagian server komputasi ALELEON Supercomputer untuk menjalankan [https://wiki.efisonlt.com/wiki/Tutorial_Menggunakan_ALELEON_Supercomputer#3B._Job_Composer_dan_Interactive_Apps '''Interactive Apps'''] seperti Jupyter Notebook, Aleleon Desktop, dll.
{| class="wikitable"
|Nodes
|1
|-
|Prosesor
|AMD Ryzen 3300X, 4 core / 8 thread, 4.3Ghz
|-
|RAM
|64GB
|-
|GPU
|NVIDIA T400 4GB
|-
|Interkoneksi
|Mellanox RoCE 25Gbps
|}


* Satu sesi Interactive Apps menggunakan satu node penuh.
=== Spesifikasi Compute Node CPU (Partisi epyc) ===
* User dapat mengalokasikan jumlah core CPU dibawah spesifikasi per node.
{| class="wikitable"
|Nodes
|3:
epyc01 -> high memory
epyc[02-03] -> normal
|-
|Prosesor per node
|1x AMD EPYC 7702P, 64 core / 128 thread, 2.0Ghz
|-
|RAM per node
|high memory -> 512GB
normal -> 256GB
|-
|Interkoneksi
|Mellanox RoCE 100Gbps
|}
 
=== Spesifikasi Compute Node GPU (Partisi gpu_ampere) ===
{| class="wikitable"
|Nodes
|1
|-
|Prosesor
|AMD Threadripper 3955WX, 16 core / 32 thread, 3.9Ghz
|-
|RAM
|128GB
|-
|GPU
|3x NVIDIA RTX 3090 24GB
|-
|Interkoneksi
|Mellanox RoCE 100Gbps
|}


=== Spesifikasi Interactive Node CPU (Partisi torti) ===
{| class="wikitable"
{| class="wikitable"
|
|Nodes
=== Partisi torti / Interactive Node CPU ===
|8
*'''8 Node atau 8 sesi Interactive Apps'''
** Spesifikasi masing-masing
*** CPU AMD Threadripper 3990X 16 v-core
*** RAM 32GB
|-
|-
|
|Prosesor per node
=== Partisi tilla / Interactive Node GPU ===
|AMD Threadripper 3990X, 16 v-core, 2.9Ghz
*'''1 Node atau 1 sesi Interactive Apps'''
|-
** CPU AMD Ryzen 5600X 6 cores / 12 threads
|RAM per node
** GPU 1x NVIDIA RTX 3090 24GB
|32GB
** RAM 64GB
|-
|Interkoneksi
|Ethernet 10GbE
|}
|}


== '''Spesifikasi Hardware: Network dan Storage''' ==
=== Spesifikasi Interactive Node GPU (Partisi tilla) ===
{| class="wikitable"
|Nodes
|1
|-
|Prosesor
|AMD Ryzen 5600X, 6 core / 12 thread, 3.7Ghz
|-
|RAM
|64GB
|-
|GPU
|1x NVIDIA RTX 3090 24GB
|-
|Interkoneksi
|Ethernet 10GbE
|}


* '''Network:'''
=== Spesifikasi Storage ===
** High speed network untuk data dan komputasi paralel: '''100 GbE RoCE QSFP28 Mellanox'''
{| class="wikitable"
** Internet bandwidth: '''100Mbps'''  
|Filesystem
* '''Storage:'''
|NFS
** Data terpusat: '''20TB RAID10'''
|-
** Caching scratch: '''1TB SSD NVMe PCIe 4.0'''
|HOME and work
|20TB
+ ''64TB (coming soon)''
|-
|SCRATCH caching
|1TB NVMe 4.0
|-
|Interkoneksi
|Mellanox RoCE 100Gbps
|}
{{DISPLAYTITLE:Spesifikasi ALELEON Supercomputer}}
{{DISPLAYTITLE:Spesifikasi ALELEON Supercomputer}}
__TOC__
__TOC__
Baris 58: Baris 131:
* '''Sistem Operasi'''
* '''Sistem Operasi'''
** Linux CentOS 7.9 dengan kernel 5.4.100-1el7.elrepo.x86_64
** Linux CentOS 7.9 dengan kernel 5.4.100-1el7.elrepo.x86_64
** ''Rocky Linux 8.5 (coming soon)''
* '''Autentikasi Login'''
* '''Autentikasi Login'''
** OpenVPN dan PAM
** OpenVPN dan PAM
* '''Akses Konsol'''
** Custom [[Tutorial Menggunakan ALELEON Supercomputer|'''EFIRO OnDemand''']], diakses melalui web browser
* '''GCC default OS'''
* '''GCC default OS'''
** GNU RHEL 10.2.0  
** GNU RHEL 10.2.0  
* '''Manajemen Job'''  
* '''Manajemen Job'''  
** SLURM 20.11.5 dengan protokol PMIX, UCX, CUDA, dan auto load-balancing menyesuaikan arsitektur AMD Zen2.
** SLURM 20.11.5 dengan protokol PMIX, UCX, CUDA, dan auto load-balancing menyesuaikan arsitektur AMD Zen2.
** EFIRO Job Composer dan Interactive Apps
* '''Modul instalasi dan software untuk user'''
* '''Modul instalasi dan software untuk user'''
** EasyBuild 4.4.2
** EasyBuild 4.4.2
** Lmod 8.1.18
** Lmod 8.1.18
* '''Katalog lengkap software'''
* '''Profiler'''
** AMD μProf
* '''Katalog lengkap software compilers, libs, framework:'''  
** '''[[Katalog Software ALELEON Supercomputer]]'''
** '''[[Katalog Software ALELEON Supercomputer]]'''
__PAKSADAFTARISI__
__PAKSADAFTARISI__

Revisi per 21 September 2022 07.41

32GB8ALELEON Supercomputer saat ini menggunakan HPC ALELEON Mk.III - superkomputer custom EFISON generasi ketiga yang akan beroperasi pada November 2022 untuk menjalankan arsitektur EFIRO.

Spesifikasi Hardware

Terdapat 3 jenis node:

  • Login Node: tempat user login ke ALELEON Supercomputer. Tidak untuk menjalankan komputasi berat
  • Compute Node: Node untuk menjalankan job komputasi user via SLURM dari Login Node.
  • Interactive Node: Node untuk menjalankan sesi interaktif via EFIRO seperti ALELEON Desktop atau Jupyter Lab.

Spesifikasi Login Node Utama (Coming Soon)

Nodes 1
Prosesor AMD EPYC 7313P, 16 v-core, 3.0Ghz
RAM 64GB
Interkoneksi Mellanox RoCE 25Gbps

Spesifikasi Login Node GPU dan backup

Nodes 1
Prosesor AMD Ryzen 3300X, 4 core / 8 thread, 4.3Ghz
RAM 64GB
GPU NVIDIA T400 4GB
Interkoneksi Mellanox RoCE 25Gbps

Spesifikasi Compute Node CPU (Partisi epyc)

Nodes 3:

epyc01 -> high memory epyc[02-03] -> normal

Prosesor per node 1x AMD EPYC 7702P, 64 core / 128 thread, 2.0Ghz
RAM per node high memory -> 512GB

normal -> 256GB

Interkoneksi Mellanox RoCE 100Gbps

Spesifikasi Compute Node GPU (Partisi gpu_ampere)

Nodes 1
Prosesor AMD Threadripper 3955WX, 16 core / 32 thread, 3.9Ghz
RAM 128GB
GPU 3x NVIDIA RTX 3090 24GB
Interkoneksi Mellanox RoCE 100Gbps

Spesifikasi Interactive Node CPU (Partisi torti)

Nodes 8
Prosesor per node AMD Threadripper 3990X, 16 v-core, 2.9Ghz
RAM per node 32GB
Interkoneksi Ethernet 10GbE

Spesifikasi Interactive Node GPU (Partisi tilla)

Nodes 1
Prosesor AMD Ryzen 5600X, 6 core / 12 thread, 3.7Ghz
RAM 64GB
GPU 1x NVIDIA RTX 3090 24GB
Interkoneksi Ethernet 10GbE

Spesifikasi Storage

Filesystem NFS
HOME and work 20TB

+ 64TB (coming soon)

SCRATCH caching 1TB NVMe 4.0
Interkoneksi Mellanox RoCE 100Gbps

Spesifikasi Sistem Operasi

  • Sistem Operasi
    • Linux CentOS 7.9 dengan kernel 5.4.100-1el7.elrepo.x86_64
    • Rocky Linux 8.5 (coming soon)
  • Autentikasi Login
    • OpenVPN dan PAM
  • GCC default OS
    • GNU RHEL 10.2.0
  • Manajemen Job
    • SLURM 20.11.5 dengan protokol PMIX, UCX, CUDA, dan auto load-balancing menyesuaikan arsitektur AMD Zen2.
  • Modul instalasi dan software untuk user
    • EasyBuild 4.4.2
    • Lmod 8.1.18
  • Profiler
    • AMD μProf
  • Katalog lengkap software compilers, libs, framework: