Spesifikasi ALELEON Supercomputer: Perbedaan antara revisi

Dari ALELEON by EFISON
(→‎Spesifikasi Software Sistem: update menyesuaikan maintenance 120124)
(edit kapasitas efektif mem)
 
(2 revisi perantara oleh pengguna yang sama tidak ditampilkan)
Baris 1: Baris 1:
ALELEON Supercomputer saat ini menggunakan '''HPC ALELEON Mk.III''' - superkomputer ''custom'' EFISON generasi ketiga menyesuaikan arsitektur EFIRO.
ALELEON Supercomputer saat ini menggunakan '''HPC ALELEON Mk.III''' - superkomputer ''custom'' EFISON generasi ketiga menyesuaikan arsitektur EFIRO.


== '''Spesifikasi Compute Node''' ==
== '''''Spesifikasi Compute Node''''' ==
Compute Node menjalankan komputasi user via job submission SLURM (sbatch terminal atau Job Composer EFIRO).
Compute Node menjalankan komputasi user via job submission SLURM (sbatch terminal atau Job Composer EFIRO).
{| class="wikitable"
{| class="wikitable"
! colspan="2" |Spesifikasi Compute Node CPU
! colspan="2" |Spesifikasi Compute Node CPU


=== Partisi epyc ===
=== Partisi epyc [[Berkas:GMB CPU icon.png|nirbing|80x80px]] ===
|-
|-
|Nodes
|Nodes
Baris 27: Baris 27:
! colspan="2" |Spesifikasi Compute Node GPU
! colspan="2" |Spesifikasi Compute Node GPU


=== Partisi ampere ===
=== Partisi ampere[[Berkas:GMB GPU icon.png|nirbing|100x100px]] ===
|-
|-
|Nodes
|Nodes
Baris 36: Baris 36:
|-
|-
|RAM
|RAM
|128GB
|120GB efektif
|-
|-
|GPU
|GPU
|2x NVIDIA RTX 3090 24GB NVLink
|2x NVIDIA RTX 3090 24GB NVLink
* ''Arsitektur NVIDIA Ampere''
* ''Tidak mendukung CUDA 11 kebawah.''
|-
|-
|Interkoneksi
|Interkoneksi
Baris 45: Baris 48:
|}
|}


== '''Spesifikasi Interactive Node''' ==
== '''''Spesifikasi Interactive Node''''' ==
Interactive Node menjalankan sesi interaktif pada web service EFIRO seperti Jupyter dan ALELEON Virtual Desktop.
Interactive Node menjalankan sesi interaktif pada web service EFIRO seperti Jupyter dan ALELEON Virtual Desktop.
{| class="wikitable"
{| class="wikitable"
! colspan="2" |Spesifikasi Interactive Node CPU
! colspan="2" |Spesifikasi Interactive Node CPU


=== Partisi torti ===
=== Partisi torti [[Berkas:GMB CPU icon.png|nirbing|80x80px]] ===
|-
|-
|Nodes
|Nodes
Baris 59: Baris 62:
|-
|-
|RAM per node
|RAM per node
|64GB
|55GB efektif
|-
|-
! colspan="2" |Spesifikasi Interactive Node GPU
! colspan="2" |Spesifikasi Interactive Node GPU


=== Partisi tilla ===
=== Partisi tilla[[Berkas:GMB GPU icon.png|nirbing|100x100px]] ===
|-
|-
|Nodes
|Nodes
Baris 72: Baris 75:
|-
|-
|RAM per node
|RAM per node
|64GB
|55GB efektif
|-
|-
|GPU per node
|GPU per node
|1x NVIDIA RTX 3090 24GB
|1x NVIDIA RTX 3090 24GB
* ''Arsitektur NVIDIA Ampere''
* ''Tidak mendukung CUDA 11 kebawah.''
|}
|}


== '''Spesifikasi Storage''' ==
== '''''Spesifikasi Storage''''' ==
Sistem melakukan checkpoint snapshot storage per 24 jam.  
Sistem melakukan checkpoint snapshot storage per 24 jam.  


Baris 101: Baris 107:
__TOC__
__TOC__


== '''Spesifikasi Software Sistem''' ==
== '''''Spesifikasi Software Sistem''''' ==


* '''Sistem Operasi'''
* '''Sistem Operasi'''
Baris 109: Baris 115:
*'''Manajemen Job (job scheduler)'''
*'''Manajemen Job (job scheduler)'''
** SLURM 23.11.1-1 dengan protokol PMIX, UCX, CUDA, dan auto load-balancing menyesuaikan spesifikasi ALELEON Supercomputer.
** SLURM 23.11.1-1 dengan protokol PMIX, UCX, CUDA, dan auto load-balancing menyesuaikan spesifikasi ALELEON Supercomputer.
*'''[https://wiki.efisonlt.com/wiki/Menggunakan_ALELEON_Supercomputer_via_EFIRO EFIRO Web Service] untuk login web dengan tampilan grafis (GUI)'''
*'''[[https://wiki.efisonlt.com/wiki/Menggunakan_ALELEON_Supercomputer_via_EFIRO EFIRO Web Service]] untuk login web dengan tampilan grafis (GUI)'''
**Berbasiskan '''Open OnDemand 3.0''' dengan modifikasi oleh tim engineering EFISON menyesuaikan arsitektur dan fitur ALELEON Supercomputer
**Berbasiskan '''Open OnDemand 3.0''' dengan modifikasi oleh tim engineering EFISON menyesuaikan arsitektur dan fitur ALELEON Supercomputer
***''MIT License, maintained by Ohio Supercomputing Center (OSC), a member of the Ohio Technology Consortium, the technology and information division of the Ohio Department of High Education.''
**''MIT License, maintained by Ohio Supercomputing Center (OSC), a member of the Ohio Technology Consortium, the technology and information division of the Ohio Department of High Education.''
* '''Manajemen modul software (Module Environment)'''
* '''Manajemen modul software (Module Environment)'''
** Lmod 8.7.32
** Lmod 8.7.32
*'''Manajemen instalasi software (Package Manager)'''
*'''Manajemen instalasi software (Package Manager)'''
**EasyBuild 4.8.0
**EasyBuild 4.9.4
**Anaconda
**Spack (berbagai versi melalui modul - default Spack 0.21.1)
**Spack 0.19.1  
*'''Environment Python'''
*'''Manajemen compiling otomatis'''
**Basis Python 3, tidak mendukung Python 2
**GNU Make 4.2.1
**Python 3 default OS versi 3.9.19
**CMake 3.26.3
*'''Package Manager Python'''
**Anaconda (berbagai versi melalui modul)
**Mamba (berbagai versi melalui modul)
**Mendukung package manager pip dan conda. Ketentuan site-packages lihat '''[<nowiki/>[[Komputasi Python]]]'''
* '''Manajemen container'''  
* '''Manajemen container'''  
** Singularity 3.10
** Apptainer 1.3.3
*'''Manajemen compiling OS'''
**Automake, CMake, make (berbagai versi melalui modul)
* '''Profiler sistem'''
* '''Profiler sistem'''
** CPU -> AMD μProf
** CPU -> AMD μProf
Baris 128: Baris 139:
** HDF5 1.14.1  
** HDF5 1.14.1  
** NetCDF 4.9.2
** NetCDF 4.9.2
* '''Katalog lengkap software compiler, library, dan framework untuk penggunaan global'''  
* '''Katalog lengkap modul software''' lihat laman:
** Lihat laman '''[[Katalog Software ALELEON Supercomputer]]'''
[[Berkas:Banner Katalog 1 4 2.jpg|1000x1000px |link=Katalog Software ALELEON Supercomputer |alt=Katalog Software ALELEON Supercomputer ]]
 
__TANPADAFTARISI__
__TANPADAFTARISI__

Revisi terkini sejak 6 Mei 2025 06.01

ALELEON Supercomputer saat ini menggunakan HPC ALELEON Mk.III - superkomputer custom EFISON generasi ketiga menyesuaikan arsitektur EFIRO.

Spesifikasi Compute Node

Compute Node menjalankan komputasi user via job submission SLURM (sbatch terminal atau Job Composer EFIRO).

Spesifikasi Compute Node CPU

Partisi epyc GMB CPU icon.png

Nodes 3
  • epyc001 -> high memory
  • epyc[002-003] -> normal
CPU per node 1x AMD EPYC 7702P, 64 core / 128 thread, 2.0Ghz
RAM per node
  • high memory -> 500GB efektif
  • normal -> 240GB efektif
Interkoneksi Mellanox RoCE 100Gbps
Spesifikasi Compute Node GPU

Partisi ampereGMB GPU icon.png

Nodes 1
CPU 1x AMD Threadripper 3955WX, 16 core / 32 thread, 3.9Ghz
RAM 120GB efektif
GPU 2x NVIDIA RTX 3090 24GB NVLink
  • Arsitektur NVIDIA Ampere
  • Tidak mendukung CUDA 11 kebawah.
Interkoneksi Mellanox RoCE 25Gbps

Spesifikasi Interactive Node

Interactive Node menjalankan sesi interaktif pada web service EFIRO seperti Jupyter dan ALELEON Virtual Desktop.

Spesifikasi Interactive Node CPU

Partisi torti GMB CPU icon.png

Nodes 2
CPU per node AMD Threadripper 3990X, 32 v-core, 2.9Ghz
RAM per node 55GB efektif
Spesifikasi Interactive Node GPU

Partisi tillaGMB GPU icon.png

Nodes 2
CPU per node AMD Threadripper 3990X, 32 v-core, 2.9Ghz
RAM per node 55GB efektif
GPU per node 1x NVIDIA RTX 3090 24GB
  • Arsitektur NVIDIA Ampere
  • Tidak mendukung CUDA 11 kebawah.

Spesifikasi Storage

Sistem melakukan checkpoint snapshot storage per 24 jam.

  • User dapat melayangkan permintaan ke email support untuk recovery data apabila tidak sengaja menghapus data.
Spesifikasi Stoarge Node
Jenis storage Block-storage, protokol NFS
HOME and workdir HDD SAS 83TiB efektif
SCRATCH caching SSD 1TB NVMe 4.0
Interkoneksi Mellanox RoCE 100Gbps

Spesifikasi Software Sistem

  • Sistem Operasi
    • Rocky Linux 8 (Red-hat based) dengan kernel 5.4.266-1.el8.elrepo.x86_64
  • Autentikasi Login
    • OpenVPN dan PAM
  • Manajemen Job (job scheduler)
    • SLURM 23.11.1-1 dengan protokol PMIX, UCX, CUDA, dan auto load-balancing menyesuaikan spesifikasi ALELEON Supercomputer.
  • [EFIRO Web Service] untuk login web dengan tampilan grafis (GUI)
    • Berbasiskan Open OnDemand 3.0 dengan modifikasi oleh tim engineering EFISON menyesuaikan arsitektur dan fitur ALELEON Supercomputer
    • MIT License, maintained by Ohio Supercomputing Center (OSC), a member of the Ohio Technology Consortium, the technology and information division of the Ohio Department of High Education.
  • Manajemen modul software (Module Environment)
    • Lmod 8.7.32
  • Manajemen instalasi software (Package Manager)
    • EasyBuild 4.9.4
    • Spack (berbagai versi melalui modul - default Spack 0.21.1)
  • Environment Python
    • Basis Python 3, tidak mendukung Python 2
    • Python 3 default OS versi 3.9.19
  • Package Manager Python
    • Anaconda (berbagai versi melalui modul)
    • Mamba (berbagai versi melalui modul)
    • Mendukung package manager pip dan conda. Ketentuan site-packages lihat [Komputasi Python]
  • Manajemen container
    • Apptainer 1.3.3
  • Manajemen compiling OS
    • Automake, CMake, make (berbagai versi melalui modul)
  • Profiler sistem
    • CPU -> AMD μProf
  • Library I/O sistem
    • HDF5 1.14.1
    • NetCDF 4.9.2
  • Katalog lengkap modul software lihat laman:

Katalog Software ALELEON Supercomputer