Spesifikasi ALELEON Supercomputer: Perbedaan antara revisi

Dari ALELEON by EFISON
(→‎Spesifikasi Software Sistem: menambah info open ondemand)
(→‎Spesifikasi Software Sistem: update menyesuaikan maintenance 120124)
 
(7 revisi perantara oleh pengguna yang sama tidak ditampilkan)
Baris 1: Baris 1:
ALELEON Supercomputer saat ini menggunakan '''HPC ALELEON Mk.III''' - superkomputer ''custom'' EFISON generasi ketiga menyesuaikan arsitektur EFIRO.
ALELEON Supercomputer saat ini menggunakan '''HPC ALELEON Mk.III''' - superkomputer ''custom'' EFISON generasi ketiga menyesuaikan arsitektur EFIRO.


== '''Spesifikasi Hardware''' ==
== '''Spesifikasi Compute Node''' ==
Terdapat 3 jenis node:
Compute Node menjalankan komputasi user via job submission SLURM (sbatch terminal atau Job Composer EFIRO).
{| class="wikitable"
! colspan="2" |Spesifikasi Compute Node CPU


* '''Login Node''' -> tempat user login ke ALELEON Supercomputer. Tidak untuk menjalankan komputasi berat
=== Partisi epyc ===
* '''Compute Node''' ->  Node untuk menjalankan job komputasi user via SLURM dari Login Node.
|-
* I'''nteractive Node''' -> Node untuk menjalankan sesi interaktif via EFIRO seperti ALELEON Desktop atau Jupyter Lab / Notebook.
 
=== Spesifikasi Compute Node CPU (Partisi epyc) ===
{| class="wikitable"
|Nodes
|Nodes
|3
|3
Baris 26: Baris 24:
|Interkoneksi
|Interkoneksi
|Mellanox RoCE 100Gbps
|Mellanox RoCE 100Gbps
|}
|-
! colspan="2" |Spesifikasi Compute Node GPU


=== Spesifikasi Compute Node GPU (Partisi gpu_ampere) ===
=== Partisi ampere ===
{| class="wikitable"
|-
|Nodes
|Nodes
|1
|1
|-
|-
|CPU
|CPU
|AMD Threadripper 3955WX, 16 core / 32 thread, 3.9Ghz  
|1x AMD Threadripper 3955WX, 16 core / 32 thread, 3.9Ghz
|-
|-
|RAM
|RAM
Baris 46: Baris 45:
|}
|}


=== Spesifikasi Interactive Node CPU (Partisi torti) ===
== '''Spesifikasi Interactive Node''' ==
Interactive Node menjalankan sesi interaktif pada web service EFIRO seperti Jupyter dan ALELEON Virtual Desktop.
{| class="wikitable"
{| class="wikitable"
! colspan="2" |Spesifikasi Interactive Node CPU
=== Partisi torti ===
|-
|Nodes
|Nodes
|2
|2
Baris 56: Baris 60:
|RAM per node
|RAM per node
|64GB
|64GB
|}
|-
! colspan="2" |Spesifikasi Interactive Node GPU


=== Spesifikasi Interactive Node GPU (Partisi tilla) ===
=== Partisi tilla ===
{| class="wikitable"
|-
|Nodes
|Nodes
|2
|2
Baris 73: Baris 78:
|}
|}


=== Spesifikasi Storage ===
== '''Spesifikasi Storage''' ==
Sistem melakukan checkpoint snapshot storage per 24 jam.
 
* '''User dapat melayangkan permintaan ke email support untuk recovery data apabila tidak sengaja menghapus data.'''
 
{| class="wikitable"
{| class="wikitable"
! colspan="2" |Spesifikasi Stoarge Node
|-
|Jenis storage
|Jenis storage
|Block-storage, protokol NFS
|Block-storage, protokol NFS
Baris 89: Baris 100:
{{DISPLAYTITLE:Spesifikasi ALELEON Supercomputer}}
{{DISPLAYTITLE:Spesifikasi ALELEON Supercomputer}}
__TOC__
__TOC__
Sistem melakukan checkpoint snapshot storage per 24 jam. '''User dapat melayangkan permintaan ke email support untuk recovery data apabila tidak sengaja menghapus data.'''


== '''Spesifikasi Software Sistem''' ==
== '''Spesifikasi Software Sistem''' ==


* '''Sistem Operasi'''
* '''Sistem Operasi'''
** Rocky Linux 8 dengan Kernel 4.18.0-425.3.1.el8.x86_64
** Rocky Linux 8 (Red-hat based) dengan kernel 5.4.266-1.el8.elrepo.x86_64
* '''Autentikasi Login'''
* '''Autentikasi Login'''
** OpenVPN dan PAM
** OpenVPN dan PAM
*'''[https://wiki.efisonlt.com/wiki/Menggunakan_ALELEON_Supercomputer_via_EFIRO EFIRO Web Service] untuk login web dengan tampilan grafis (GUI)'''  
*'''Manajemen Job (job scheduler)'''
**Berbasiskan '''Open OnDemand''' dengan modifikasi menyesuaikan penggunaan spesifik ALELEON Supercomputer
** SLURM 23.11.1-1 dengan protokol PMIX, UCX, CUDA, dan auto load-balancing menyesuaikan spesifikasi ALELEON Supercomputer.
**Menggunakan interactive package Jupyter Notebook, Jupyter Lab, dan Virtual Desktop Session (ALELEON Desktop)
*'''[https://wiki.efisonlt.com/wiki/Menggunakan_ALELEON_Supercomputer_via_EFIRO EFIRO Web Service] untuk login web dengan tampilan grafis (GUI)'''
**Lisensi MIT
**Berbasiskan '''Open OnDemand 3.0''' dengan modifikasi oleh tim engineering EFISON menyesuaikan arsitektur dan fitur ALELEON Supercomputer
* '''Manajemen Job (job scheduler)'''
***''MIT License, maintained by Ohio Supercomputing Center (OSC), a member of the Ohio Technology Consortium, the technology and information division of the Ohio Department of High Education.''
** SLURM 20.11.9 dengan protokol PMIX, UCX, CUDA, dan auto load-balancing menyesuaikan arsitektur AMD Zen 2.
* '''Manajemen modul software (Module Environment)'''
* '''Manajemen modul software (module environment)'''
** Lmod 8.7.32
** Lmod 8.1.18
*'''Manajemen instalasi software (Package Manager)'''
*'''Manajemen instalasi software (package manager)'''
**EasyBuild 4.8.0
**EasyBuild 4.7.0
**Anaconda  
**Conda ''(melalui module environment Anaconda 3 suite)''
**Spack 0.19.1
**Spack 0.17.2 ''(melalui module environment)''
*'''Manajemen compiling otomatis'''
*'''Manajemen compiling otomatis'''
**GNU Make 4.2.1
**GNU Make 4.2.1
**CMake 3.24.3 ''(melalui module environment)''
**CMake 3.26.3  
* '''Manajemen container'''
** Singularity 3.10
* '''Profiler sistem'''
* '''Profiler sistem'''
** CPU -> AMD μProf
** CPU -> AMD μProf
* '''Provisioning sistem'''
** WareWulf 4.0
* '''Library I/O sistem'''
* '''Library I/O sistem'''
** HDF5 1.12.1 ''(melalui module environment)''
** HDF5 1.14.1  
** NetCDF 4.8.1 ''(melalui module environment)''
** NetCDF 4.9.2
* '''Dukungan compiler dan interpreter default OS:'''
** GCC Red Hat 8.5.0-15
** Python 3.9.13
** Perl 5.26.5
* '''Katalog lengkap software compiler, library, dan framework untuk penggunaan global'''  
* '''Katalog lengkap software compiler, library, dan framework untuk penggunaan global'''  
** '''[[Katalog Software ALELEON Supercomputer]]'''
** Lihat laman '''[[Katalog Software ALELEON Supercomputer]]'''
__TANPADAFTARISI__
__TANPADAFTARISI__

Revisi terkini sejak 18 Januari 2024 06.40

ALELEON Supercomputer saat ini menggunakan HPC ALELEON Mk.III - superkomputer custom EFISON generasi ketiga menyesuaikan arsitektur EFIRO.

Spesifikasi Compute Node

Compute Node menjalankan komputasi user via job submission SLURM (sbatch terminal atau Job Composer EFIRO).

Spesifikasi Compute Node CPU

Partisi epyc

Nodes 3
  • epyc001 -> high memory
  • epyc[002-003] -> normal
CPU per node 1x AMD EPYC 7702P, 64 core / 128 thread, 2.0Ghz
RAM per node
  • high memory -> 500GB efektif
  • normal -> 240GB efektif
Interkoneksi Mellanox RoCE 100Gbps
Spesifikasi Compute Node GPU

Partisi ampere

Nodes 1
CPU 1x AMD Threadripper 3955WX, 16 core / 32 thread, 3.9Ghz
RAM 128GB
GPU 2x NVIDIA RTX 3090 24GB NVLink
Interkoneksi Mellanox RoCE 25Gbps

Spesifikasi Interactive Node

Interactive Node menjalankan sesi interaktif pada web service EFIRO seperti Jupyter dan ALELEON Virtual Desktop.

Spesifikasi Interactive Node CPU

Partisi torti

Nodes 2
CPU per node AMD Threadripper 3990X, 32 v-core, 2.9Ghz
RAM per node 64GB
Spesifikasi Interactive Node GPU

Partisi tilla

Nodes 2
CPU per node AMD Threadripper 3990X, 32 v-core, 2.9Ghz
RAM per node 64GB
GPU per node 1x NVIDIA RTX 3090 24GB

Spesifikasi Storage

Sistem melakukan checkpoint snapshot storage per 24 jam.

  • User dapat melayangkan permintaan ke email support untuk recovery data apabila tidak sengaja menghapus data.
Spesifikasi Stoarge Node
Jenis storage Block-storage, protokol NFS
HOME and workdir HDD SAS 83TiB efektif
SCRATCH caching SSD 1TB NVMe 4.0
Interkoneksi Mellanox RoCE 100Gbps

Spesifikasi Software Sistem

  • Sistem Operasi
    • Rocky Linux 8 (Red-hat based) dengan kernel 5.4.266-1.el8.elrepo.x86_64
  • Autentikasi Login
    • OpenVPN dan PAM
  • Manajemen Job (job scheduler)
    • SLURM 23.11.1-1 dengan protokol PMIX, UCX, CUDA, dan auto load-balancing menyesuaikan spesifikasi ALELEON Supercomputer.
  • EFIRO Web Service untuk login web dengan tampilan grafis (GUI)
    • Berbasiskan Open OnDemand 3.0 dengan modifikasi oleh tim engineering EFISON menyesuaikan arsitektur dan fitur ALELEON Supercomputer
      • MIT License, maintained by Ohio Supercomputing Center (OSC), a member of the Ohio Technology Consortium, the technology and information division of the Ohio Department of High Education.
  • Manajemen modul software (Module Environment)
    • Lmod 8.7.32
  • Manajemen instalasi software (Package Manager)
    • EasyBuild 4.8.0
    • Anaconda
    • Spack 0.19.1
  • Manajemen compiling otomatis
    • GNU Make 4.2.1
    • CMake 3.26.3
  • Manajemen container
    • Singularity 3.10
  • Profiler sistem
    • CPU -> AMD μProf
  • Library I/O sistem
    • HDF5 1.14.1
    • NetCDF 4.9.2
  • Katalog lengkap software compiler, library, dan framework untuk penggunaan global