Spesifikasi ALELEON Supercomputer

Dari ALELEON by EFISON

Revisi per 11 Maret 2022 09.36 oleh WilsonLisan (bicara | kontrib) (→‎Spesifikasi Hardware: Interactive Node: fix typo)
(beda) ← Revisi sebelumnya | Revisi terkini (beda) | Revisi selanjutnya → (beda)

ALELEON Supercomputer saat ini menggunakan HPC ALELEON Mk.III - superkomputer custom EFISON generasi ketiga yang akan beroperasi pada April 2022 untuk menjalankan arsitektur EFIRO.

Spesifikasi Hardware: Compute Node

Compute Node adalah bagian bagian server komputasi ALELEON Supercomputer utama untuk menjalankan berbagai level komputasi dari kecil hingga besar.

  • Komputasi berjalan di Compute Node apabila dibuat melalui Job Composer.
  • Melalui Submit Script (bagian dari Job Composer), user bebas dalam mengalokasikan jumlah resources job misalnya menggunakan 32 core CPU + RAM 64GB atau 96 core CPU + RAM 128GB, 16 core CPU + 2 GPU, dst.

Partisi epyc / Compute Node CPU

  • Total CPU 192 cores / 384 threads, RAM 768GB
    • Terdiri dari 3 node dengan spesifikasi masing-masing:
      • CPU AMD EPYC 7702P 64 cores / 128 threads
      • RAM 256GB

Partisi gpu_ampere / Compute Node GPU

  • 1 Node
    • CPU AMD Threadripper Pro 3955WX 16 cores / 32 threads
    • GPU 3x NVIDIA RTX 3090 24GB
    • RAM 128GB

Spesifikasi Hardware: Interactive Node

Interactive node adalah bagian server komputasi ALELEON Supercomputer untuk menjalankan Interactive Apps seperti Jupyter Notebook, Aleleon Desktop, dll.

  • Satu sesi Interactive Apps menggunakan satu node penuh.
  • User dapat mengalokasikan jumlah core CPU dibawah spesifikasi per node.

Partisi torti / Interactive Node CPU

  • 8 Node atau 8 sesi Interactive Apps
    • Spesifikasi masing-masing
      • CPU AMD Threadripper 3990X 16 v-core
      • RAM 32GB

Partisi tilla / Interactive Node GPU

  • 1 Node atau 1 sesi Interactive Apps
    • CPU AMD Ryzen 5600X 6 cores / 12 threads
    • GPU 1x NVIDIA RTX 3090 24GB
    • RAM 64GB

Spesifikasi Hardware: Network dan Storage

  • Network:
    • High speed network untuk data dan komputasi paralel: 100 GbE RoCE QSFP28 Mellanox
    • Internet bandwidth: 100Mbps
  • Storage:
    • Data terpusat: 20TB RAID10
    • Caching scratch: 1TB SSD NVMe PCIe 4.0

Spesifikasi Sistem Operasi

  • Sistem Operasi
    • Linux CentOS 7.9 dengan kernel 5.4.100-1el7.elrepo.x86_64
  • Autentikasi Login
    • OpenVPN dan PAM
  • Akses Konsol
  • GCC default OS
    • GNU RHEL 10.2.0
  • Manajemen Job
    • SLURM 20.11.5 dengan protokol PMIX, UCX, CUDA, dan auto load-balancing menyesuaikan arsitektur AMD Zen2.
    • EFIRO Job Composer dan Interactive Apps
  • Modul instalasi dan software untuk user
    • EasyBuild 4.4.2
    • Lmod 8.1.18
  • Katalog lengkap software