MPI ALELEON Supercomputer

Halaman ini menjelaskan teknis menjalankan program MPI di ALELEON Supercomputer.

Open MPI UCX ALELEON Supercomputer

ALELEON Supercompter menggunakan Open MPI yang telah dioptimasi untuk arsitektur AMD Zen2. Berikut adalah sintak standar menjalankan program MPI di ALELEON Supercomputer melalui SLURM:

mpirun -np $SLURM_NTASKS <program-MPI-user...>

Keterangan:

Variabel SLURM_NTASKS menangkap jumlah ntasks (CPU) pada SLURM Submit Script sehingga user tidak perlu memasukkan jumlah proses MPI secara manual.

Bagaimana SLURM ALELEON Membagi Core Fisik dan Thread

SLURM ALELEON Supercomputer menjalankan proses Open MPI untuk selalu mengisi penuh core thread per core fisik, contoh:

32 proses MPI dijalankan oleh 16 core fisik / 32 core thread CPU.
64 proses MPI dijalankan oleh 32 core fisik / 64 core thread CPU; dan seterusnya ...

Pembagian ini didasarkan pada pengelompokan core CPU pada grup CCX dan CCD AMD Zen2 supaya memastikan penyebaran proses MPI selalu berdekatan antar grup CCX / CCD (tightly coupled) dan menghasilkan performa terbaik. Semua software komputasi ALELEON Supercomputer telah dioptimasi untuk berjalan dengan skema ini.

Skema grup CCX dan CCD pada CPU AMD yang digunakan oleh ALELEON Supercomputer

Kelipatan 2 atau 4 untuk Jumlah ntasks (Alokasi CPU)

Berdasarkan jumlah core dan grup pada gambar skema CPU diatas, kami menyarankan untuk memilih ntasks (alokasi CPU) dengan kelipatan 2 atau 4 untuk memastikan proses MPI mengisi grup CCX dan CCD yang berdekatan.

(Versi Mudah) Memilih Jumlah Alokasi Komputasi SLURM untuk Job MPI

Bagian ini menjelaskan bagaimana karakteristik default SLURM ALELEON Supercomputer menjalankan alokasi komputasi untuk job MPI dan panduan menulis SLURM Submit Script.

Menjalankan job MPI satu node dan multi-node secara otomatis

SLURM ALELEON secara otomatis dapat menjalankan job MPI baik pada satu node atau multi-node berdasarkan jumlah ntasks sehingga user cukup mendefinisikan jumlah ntasks tanpa perlu mengatur jumlah nodes.

#!/bin/bash
# Isi bagian yang ditandai 4 garing (////)

# Alokasi jumlah core thread CPU dan jumlah proses MPI 
#SBATCH --ntasks=////

# Alokasi jumlah memori RAM per node
#SBATCH --mem=////

# Parameter SBATCH lainnya ...
#SBATCH --time=////
#SBATCH --output=////
#SBATCH --error=////

# Alur jalannya program ...

mpirun -np $SLURM_NTASKS <program-MPI-user...>

Keterangan:

Jumlah ntasks maksimal untuk Partisi epyc (Compute Node CPU) adalah 384.
Jumlah ntasks maksimal untuk Partisi ampere (Compute Node GPU) adalah 32.

Jumlah node yang dipilih SLURM secara otomatis
Jumlah ntasks	Partisi epyc (CPU) *jumlah node naik setiap kelipatan 128	Partisi ampere (GPU) *maks 32 core
1 - 32	1	1
33 - 128	1	X
129 - 256	2	X
257 - 384	3	X

---

SBATCH mem = alokasi RAM per node

Parameter SBATCH mem mengalokasikan jumlah RAM per node baik pada job MPI satu node dan multi-node. Ambil contoh alokasi SBATCH berikut:

#!/bin/bash
#SBATCH --ntasks=192 
#SBATCH --mem=64GB 

# ntasks 192 menggunakan 2 node secara otomatis
# Dengan alokasi RAM 64GB per node sehingga total 128GB untuk 2 node

Job MPI mempunyai kapasitas mem maksimal:

Compute Node CPU (epyc): 240GB (per node).
Compute Node GPU (ampere): 120GB

---

Menjalankan Job Hybrid MPI / OpenMP (OMP)

SLURM dapat menjalankan job hybrid MPI / OMP dengan SBATCH cpus-per-task dan variabel SLURM_CPUS_PER_TASK seperti contoh format berikut:

#!/bin/bash
# Isi bagian yang ditandai 4 garing (////)

# Alokasi jumlah core thread CPU dan jumlah proses MPI 
#SBATCH --ntasks=////

# cpus-per-task mewakili jumlah thread OMP per proses MPI 
#SBATCH --cpus-per-task=////

# Alokasi jumlah memori RAM per node
# SBATCH --mem=////

# Parameter SBATCH lainnya ...
#SBATCH --time=////
#SBATCH --output=////
#SBATCH --error=////

# Alur jalannya program ...

# Definisi threading OMP
export OMP_NUM_THREADS=${SLURM_CPUS_PER_TASK}

mpirun -np $SLURM_NTASKS <program-MPI-user...>

Keterangan:

Total core CPU yang digunakan adalah ntasks * cpus-per-task.
Variabel SLURM_NTASKS menangkap total penghitungan core CPU diatas.

**(Versi Advanced) Memilih Jumlah Alokasi Komputasi SLURM untuk Job MPI**

Bagian ini menjelaskan bagaimana user secara manual dapat mengatur parameter SBATCH SLURM ALELEON Supercomputer untuk menjalankan job MPI.

Acuan Spesifikasi Compute Node dengan SBATCH SLURM

User dapat mengacu spesifikasi berikut untuk mengatur besar parameter SBATCH secara manual.

Spesifikasi Compute Node berdasarkan SBATCH SLURM
Parameter SBATCH	Hardware	Spesifikasi
Parameter SBATCH	Hardware	Partisi epyc (CPU)	Partisi ampere (GPU)
nodes	Jumlah node	3	1
ntasks	Total core CPU	384	32
ntasks-per-node	Total core CPU per node	128	32
mem	Memori RAM per node	240GB	120GB
gpus	Jumlah GPU	0	2

---

SBATCH nodes dan ntasks-per-node

User dapat mengatur jumlah nodes dan ntasks per node secara manual dengan parameter SBATCH nodes dan ntasks-per-node:

#!/bin/bash
# Isi bagian yang ditandai 4 garing (////)

# Jumlah node
#SBATCH --nodes=////

# Jumlah ntasks per node
#SBATCH --ntasks-per-node=////

# Alokasi jumlah memori RAM per node 
#SBATCH --mem=////

# Parameter SBATCH lainnya ...
#SBATCH --time=////
#SBATCH --output=////
#SBATCH --error=////

# Alur jalannya program ...

mpirun -np $SLURM_NTASKS <program-MPI-user...>

Keterangan:

Total core CPU yang dipesan adalah nodes * ntasks-per-node
Variabel SLURM_NTASKS menangkap total CPU diatas.

---

SBATCH nodes dan ntasks-per-node untuk Hybrid MPI / OMP

Hal sebelumnya juga dapat dilakukan untuk hybrid MPI / OMP sebagai berikut:

#!/bin/bash
# Isi bagian yang ditandai 4 garing (////)

# Jumlah node
#SBATCH --nodes=////

# Jumlah ntasks per node
#SBATCH --ntasks-per-node=////

# Jumlah threading OMP per task MPI
#SBATCH --cpus-per-task=////

# Alokasi jumlah memori RAM per node 
#SBATCH --mem=////

# Parameter SBATCH lainnya ...
#SBATCH --time=////
#SBATCH --output=////
#SBATCH --error=////

# Alur jalannya program ...

# Definisi threading OMP
export OMP_NUM_THREADS=${SLURM_CPUS_PER_TASK}

mpirun -np $SLURM_NTASKS <program-MPI-user...>

Keterangan:

Total core CPU yang dipesan adalah nodes * ntasks-per-node * cpus-per-task
Variabel SLURM_NTASKS menangkap total CPU diatas.

---

Menjalankan MPI pada Core Fisik saja

User dapat menjalankan program MPI sepenuhnya pada core fisik dengan mengalokasikan jumlah SBATCH ntasks 2 kali lipat dari proses MPI yang mau dijalankan. Contoh:

#!/bin/bash
#SBATCH --ntasks=64 

# Parameter SBATCH lainnya dan alur jalannya program ...

# Jumlah proses MPI setengah dari ntasks 
mpirun -np 32 <program-MPI-user...>

Keterangan:

Sistem akan tetap menghitung besar CPU Core Hour berdasarkan jumlah ntasks.

Article tools

Perkakas pribadi

Navigasi

Perkakas

MPI ALELEON Supercomputer

Daftar isi

Open MPI UCX ALELEON Supercomputer

Bagaimana SLURM ALELEON Membagi Core Fisik dan Thread

Kelipatan 2 atau 4 untuk Jumlah ntasks (Alokasi CPU)

(Versi Mudah) Memilih Jumlah Alokasi Komputasi SLURM untuk Job MPI

Menjalankan job MPI satu node dan multi-node secara otomatis

SBATCH mem = alokasi RAM per node

Menjalankan Job Hybrid MPI / OpenMP (OMP)

**(Versi Advanced) Memilih Jumlah Alokasi Komputasi SLURM untuk Job MPI**

Acuan Spesifikasi Compute Node dengan SBATCH SLURM

SBATCH nodes dan ntasks-per-node

SBATCH nodes dan ntasks-per-node untuk Hybrid MPI / OMP

Menjalankan MPI pada Core Fisik saja