Spesifikasi ALELEON Supercomputer: Perbedaan antara revisi

Dari ALELEON by EFISON
k (WilsonLisan memindahkan halaman Partisi Aleleon Mk.II ke Spesifikasi ALELEON Supercomputer: Menyatukan spek, partisi, dan tampilan ALELEON Supercomputer supaya lebih mudah dibaca)
(Major writing spek hardware, software, dan EFIRO)
Baris 1: Baris 1:
ALELEON Supercomputer saat ini menggunakan '''HPC ALELEON Mk.II''' - superkomputer ''custom'' EFISON generasi kedua yang beroperasi pada bulan April 2021.
== '''Spesifikasi Hardware''' ==
{{DISPLAYTITLE:Spesifikasi ALELEON Supercomputer}}
{{DISPLAYTITLE:Spesifikasi ALELEON Supercomputer}}
__TOC__
__TOC__
Partisi pada infrastruktur HPC adalah pembagian grup kluster hardware yang didefinisikan oleh scheduler. Untuk saat ini HPC Aleleon Mk.II membagi partisi menurut hardware komputasi yaitu CPU (bernama '''epyc''') dan GPU (bernama '''gpu_ampere''').
{| class="wikitable"
 
|+Hardware - per April 2021
[[Berkas:Aleleon lampu natal.jpg|nirbing|800x800px]]
!Komponen
 
!Jumlah
== '''Partisi epyc''' ==
!Spesifikasi
Partisi '''epyc''' adalah partisi untuk komputasi CPU. Partisi epyc adalah partisi DEFAULT pada SLURM sehingga user tidak perlu mendefnisikan partisi pada SBATCH. Partisi epyc mempunyai spesifikasi komputasi:
!Nama Partisi SLURM
|-
|Compute Node CPU
|3 nodes
|AMD EPYC 7702P 64 cores / 128 threads, 2.0Ghz. RAM 256GB
'''Total 192 cores / 384 threads, RAM 768GB'''
|'''epyc''' (DEFAULT)
|-
|Compute Node GPU
|1 node
|AMD Threadripper 3990X 64 cores / 128 threads, 2.9Ghz. RAM 128GB
2x NVIDIA RTX 3090 24GB GDDR6X
|'''gpu_ampere'''
|-
|Storage HOME
|1 sistem
| colspan="2" |20TB, harddisk RAID-10, terpusat
|-
|Storage SCRATCH
|1 unit
| colspan="2" |1TB, SSD NVMe PCIe 4.0. Caching untuk read / write output software komputasi  
|-
|High-speed network
| colspan="3" |100 GbE RDMA/RoCE, QSFP28 Mellanox
|-
|Storage network
| colspan="3" |10 GbE SFP+
|}


* 3 Node dengan spesifikasi masing-masing:
== '''Spesifikasi Sistem Operasi''' ==
** 1x AMD EPYC Rome 7702P 64 cores / 128 threads, 2.0GHz.
{| class="wikitable"
** RAM 256GB DDR4 ECC RDIMM, octo-channel.
|+Sistem Operasi - per Januari 2022
** Network 1 GbE, 10 GbE, 100 GbE.  
!Komponen
!Tipe
!Versi
!Spesifikasi
|-
|Sistem Operasi
|Linux CentOS
|7.9
|Kernel 5.4.100-1.el7.elrepo.x86_64
|-
|Autentikasi Login
| colspan="3" |OpenVPN, PAM
|-
|Tampilan GUI
|Custom - EFIRO OnDemand
|1.0
|Tampilan web browser untuk mengakses ALELEON Supercomputer
|-
|GCC (default)
|GNU RHEL
|10.2.0
|C/C++/Fortran, optimasi arch untuk AMD EPYC  
|-
|Manajemen
|SLURM
|20.11.5
|Dengan protokol PMIX, UCX, CUDA, auto load-balancing
|-
|Module Environment
|Lmod
|8.1.18
| -
|-
|Modul instalasi user
|Easybuild
|4.4.2
|Terintegrasi dengan Lmod
|-
|Katalog lengkap software
| colspan="3" |'''[[Katalog Software ALELEON Supercomputer]]'''
|}


== '''Partisi gpu_ampere''' ==
== '''EFIRO OnDemand''' ==
Partisi '''gpu_ampere''' adalah partisi untuk komputasi GPU. User harus mendefinisikan nama partisi gpu_ampere pada SLURM Submission Script untuk menggunakan partisi ini:
Mulai aktif pada awal tahun 2022, EFIRO OnDemand atau '''EFIRO''' untuk singkatnya adalah '''tampilan grafis (GUI) dari ALELEON Supercomputer yang dapat diakses melalui web browser'''. Melalui EFIRO, user dapat melakukan kegiatan esensial di superkomputer dari manajemen file (download / upload / editing) hingga job submission. EFIRO dirancang untuk memudahkan user dalam mengakses ALELEON Supercomputer khususnya untuk user awam yang pertama kali menggunakan superkomputer atau belum tanggap dengan sistem operasi Linux. EFIRO menyediakan tampilan secara grafis maupun terminal.
#SBATCH --partition=gpu_ampere
Partisi gpu_ampere mempunyai spesifikasi komputasi:


* 1 Node dengan spesifikasi:
[[Berkas:EFIRO Job Composer 1.png|nir|jmpl|1100x1100px|'''Tampilan EFIRO OnDemand untuk job submission di ALELEON Supercomputer''']]
** 1x AMD Threadripper 3990X 64 cores / 128 threads, 2.9GHz, full power TDP 280W.
[[Berkas:EFIRO FTP.png|nir|jmpl|900x900px|'''Layaknya penyimpanan cloud, EFIRO dapat melayani fungsi manajemen data seperti upload, download, editing, rename, copy, move, dan masih banyak lagi.''']]
** RAM 128GB DDR4 ECC UDIMM, quad-channel
** 2x NVIDIA RTX 3090 24GB GDDR6X


== '''Network dan Storage''' ==
Semua partisi terhubung dengan network dan storage terpusat:


* Storage node 20TB RAID10.
User juga dapat mengakses ALELEON Supercomputer dengan cara klasik yaitu via software terminal dan login SSH.
* Storage SCRATCH SSD NVMe PCIe 4.0 1TB.
[[Berkas:Terminal.png|nir|jmpl|800x800px|'''Cara klasik mengakses ALELEON Supercomputer melalui software terminal dan login SSH.''']]
* Network 1 GbE untuk manajemen dan koneksi internet.
* Network 10 GbE untuk komunikasi data ke storage node.
* Network 100 GbE RDMA/RoCE Mellanox untuk komunikasi komputasi paralel antar node.

Revisi per 18 Januari 2022 07.50

ALELEON Supercomputer saat ini menggunakan HPC ALELEON Mk.II - superkomputer custom EFISON generasi kedua yang beroperasi pada bulan April 2021.

Spesifikasi Hardware

Hardware - per April 2021
Komponen Jumlah Spesifikasi Nama Partisi SLURM
Compute Node CPU 3 nodes AMD EPYC 7702P 64 cores / 128 threads, 2.0Ghz. RAM 256GB

Total 192 cores / 384 threads, RAM 768GB

epyc (DEFAULT)
Compute Node GPU 1 node AMD Threadripper 3990X 64 cores / 128 threads, 2.9Ghz. RAM 128GB

2x NVIDIA RTX 3090 24GB GDDR6X

gpu_ampere
Storage HOME 1 sistem 20TB, harddisk RAID-10, terpusat
Storage SCRATCH 1 unit 1TB, SSD NVMe PCIe 4.0. Caching untuk read / write output software komputasi
High-speed network 100 GbE RDMA/RoCE, QSFP28 Mellanox
Storage network 10 GbE SFP+

Spesifikasi Sistem Operasi

Sistem Operasi - per Januari 2022
Komponen Tipe Versi Spesifikasi
Sistem Operasi Linux CentOS 7.9 Kernel 5.4.100-1.el7.elrepo.x86_64
Autentikasi Login OpenVPN, PAM
Tampilan GUI Custom - EFIRO OnDemand 1.0 Tampilan web browser untuk mengakses ALELEON Supercomputer
GCC (default) GNU RHEL 10.2.0 C/C++/Fortran, optimasi arch untuk AMD EPYC
Manajemen SLURM 20.11.5 Dengan protokol PMIX, UCX, CUDA, auto load-balancing
Module Environment Lmod 8.1.18 -
Modul instalasi user Easybuild 4.4.2 Terintegrasi dengan Lmod
Katalog lengkap software Katalog Software ALELEON Supercomputer

EFIRO OnDemand

Mulai aktif pada awal tahun 2022, EFIRO OnDemand atau EFIRO untuk singkatnya adalah tampilan grafis (GUI) dari ALELEON Supercomputer yang dapat diakses melalui web browser. Melalui EFIRO, user dapat melakukan kegiatan esensial di superkomputer dari manajemen file (download / upload / editing) hingga job submission. EFIRO dirancang untuk memudahkan user dalam mengakses ALELEON Supercomputer khususnya untuk user awam yang pertama kali menggunakan superkomputer atau belum tanggap dengan sistem operasi Linux. EFIRO menyediakan tampilan secara grafis maupun terminal.

Tampilan EFIRO OnDemand untuk job submission di ALELEON Supercomputer
Layaknya penyimpanan cloud, EFIRO dapat melayani fungsi manajemen data seperti upload, download, editing, rename, copy, move, dan masih banyak lagi.


User juga dapat mengakses ALELEON Supercomputer dengan cara klasik yaitu via software terminal dan login SSH.

Cara klasik mengakses ALELEON Supercomputer melalui software terminal dan login SSH.