FLACS-CFD

Dari ALELEON by EFISON

Revisi sejak 12 Januari 2024 04.49 oleh WilsonLisan (bicara | kontrib) (fix formatting)

FLACS-CFD adalah software industri CFD buatan Gexcon (in-house software) untuk pemodelan ledakan dan keamanan desain konstruksi pabrik khususnya dari sisi simulasi persebaran api, asap, dan gas beracun ketika terjadi kecelakaan.

LICENSED SOFTWARE!
Software ini berjalan di ALELEON Supercomputer melalui FLACS License Manager dengan izin lisensi yang dikelola oleh PT. Gexcon Indonesia.

Versi yang Tersedia

Berikut adalah detail versi FLACS-CFD yang tersedia secara global di ALELEON Supercomputer:

Modul FLACS-CFD
Versi Nama Modul Dukungan Hardware
CPU GPU OMP Threading MPI Multi-Node
21.3 flacs-cfd/21.3 V X V X
22.1 flacs-cfd/22.1 V X V X

Skema Menjalankan FLACS-CFD

Terdapat dua cara dalam menjalankan FLACS-CFD:

  1. Menjalankan satu simulasi per job submission.
  2. Menjalankan banyak simulasi sekaligus dalam satu job submission dengan metode SLURM Array.

Menjalankan FLACS-CFD dengan SLURM Array

Metode ini memungkinkan user untuk menjalankan banyak simulasi sekaligus dalam satu job submission. Terdapat beberapa hal yang perlu diperhatikan:

  • Menggunakan parameter SBATCH SLURM dengan rumus:
#SBATCH --array=1-<jumlah-job-simulasi>

Contoh user menjalankan 8 job simulasi, maka parameter array menjadi: 
#SBATCH --array=1-8
  • Nama file input menggunakan metode wildcard.
  • Ketika menjalankan array, alokasi SBATCH ntasks (core thread CPU) dan mem (memori RAM) digunakan oleh setiap array job.
Contoh user mengalokasikan ntasks 2 dan mem 4GB untuk 8 job array
#SBATCH --array=1-8
#SBATCH --ntasks=2
#SBATCH --mem=4GB 

Maka total alokasi adalah CPU 8*2 = 16 core dan memori RAM 8*4GB = 32GB 

Menjalankan FLACS-CFD

User dapat menjalankan komputasi dengan pilihan cara melalui terminal atau website EFIRO (klik expand atau kembangkan).

Opsi Menggunakan terminal (SLURM sbatch)

Langkah Menjalankan FLACS-CFD di Terminal

Sbatch Terminal.png

0

Login SSH

Tatacara login SSH lihat laman Login SSH ALELEON Supercomputer.

1
Menyiapkan File Komputasi

Siapkan file yang dibutuhkan untuk komputasi user, rekomendasi dalam satu folder per job:

  • File input dan data komputasi.
    • User dapat upload / download file ke ALELEON dengan software FTP.
  • Membuat SLURM Submit Script yaitu 'formulir' untuk menjalankan job komputasi.
    • Nama script bebas dengan format file .sh (bash), contoh my_job_submission.sh
$ mkdir kerjaanskripsi
$ cd kerjaanskripsi
$ nano my_job_submission.sh

... upload / menyiapkan / edit input dan data komputasi ...
2
Template SLURM Submit Script FLACS-CFD

Ikuti panduan template berikut dan petunjuk NOTES di dalamnya.

Template SLURM Submit Script untuk FLACS-CFD
#!/bin/bash

# -----------------------------------------------------
# Template SLURM Submit Script
# FLACS-CFD | rev.080124
# 
# NOTES: 
# 1. Isi bagian yang ditandai 4 garing (////).
# 2. Template ini bersifat referensi.
#    User dapat mengubah bagian yang perlu diubah.
# -----------------------------------------------------

# -----------------------------------------------------
# Alokasi komputasi SBATCH, input, dan module
# -----------------------------------------------------

# Alokasi jumlah core thread CPU
#SBATCH --ntasks=////

# Alokasi jumlah memori RAM (satuan GB)
#SBATCH --mem=////GB

# Alokasi limit waktu menjalankan job
# Format HH:MM:SS atau D-HH:MM:SS
#SBATCH --time=////

# Definisi file untuk menampung output terminal program
#SBATCH --output=result-%j.txt

# Definisi file untuk menampung output error log    
#SBATCH --error=error-%j.txt 

# Memuat modul software FLACS-CFD
# Daftar modul lihat subbab "Modul FLACS-CFD" di atas 
module load flacs-cfd////

# ----------------------------------------------------
# Script jalannya program
# ----------------------------------------------------

fgc - ////
run_flacscfd_omp ////
Template SLURM Submit Script untuk FLACS-CFD dengan skema Array
#!/bin/bash

# -----------------------------------------------------
# Template SLURM Submit Script
# FLACS-CFD Array | rev.080124
# 
# NOTES: 
# 1. Isi bagian yang ditandai 4 garing (////).
# 2. Template ini bersifat referensi.
#    User dapat mengubah bagian yang perlu diubah.
# -----------------------------------------------------

# -----------------------------------------------------
# Alokasi komputasi SBATCH, input, dan module
# -----------------------------------------------------

# Alokasi jumlah core thread CPU
#SBATCH --ntasks=////

# Jumlah job array, contoh: 1-128
#SBATCH --array=////

# Alokasi jumlah memori RAM (satuan GB)
#SBATCH --mem=////GB

# Alokasi limit waktu menjalankan job
# Format HH:MM:SS atau D-HH:MM:SS
#SBATCH --time=////

# Definisi file untuk menampung output terminal program
#SBATCH --output=result-%j.txt

# Definisi file untuk menampung output error log    
#SBATCH --error=error-%j.txt 

# FLACS CS INPUT FILES WITH WILDCARD. Example: cs??????.dat3
INPUT_FILE="cs////.dat3"

# Memuat modul software FLACS-CFD
# Daftar modul lihat subbab "Modul FLACS-CFD" di atas 
module load flacs-cfd////

# ----------------------------------------------------
# Script jalannya program
# ----------------------------------------------------

# Abbreviate some SLURM variables for brevity/readability
TASK_MIN=${SLURM_ARRAY_TASK_MIN}
TASK_MAX=${SLURM_ARRAY_TASK_MAX}
TASK_ID=${SLURM_ARRAY_TASK_ID}
TASK_COUNT=${SLURM_ARRAY_TASK_COUNT}

# Form a list of relevant files, and check the number of array elements
# matches the number of cases with 6-digit identifiers.
CS_FILES=(`ls -1 ${INPUT_FILE}`)

if test "${#CS_FILES[@]}" -ne "${TASK_COUNT}";
then
  printf "Number of files is:       %s\n" "${#CS_FILES[@]}"
  printf "Number of array tasks is: %s\n" "${TASK_COUNT}"
  printf "Do not match!\n"
fi

# All tasks loop through the entire list to find their specific case.

for (( jid = $((${TASK_MIN})); jid <= $((${TASK_MAX})); jid++ ));
do
  if test "${TASK_ID}" -eq "${jid}";
  then
      # File list index with offset zero
      file_id=$((${jid} - ${TASK_MIN}))
      # Form the substring file_id (recall syntax is :offset:length)
      my_file=${CS_FILES[${file_id}]}
      my_file_id=${my_file:2:6}
  fi
done

printf "Task %d has file %s id %s\n" "${TASK_ID}" "${my_file}" "${my_file_id}"

# Running fgc and FLACS CFD
fgc - ${my_file_id}
run_flacscfd_omp ${my_file_id}
Panduan Nilai Maksimal SBATCH untuk FLACS-CFD
Panduan Nilai Maksimal SBATCH ntasks, mem, gpus, time
Skenario Komputasi (CPU)1 (RAM)1 gpus

(GPU)

time

(time limit)

Fair policy usage untuk akumulasi semua job2 128 128GB 2 3-00:00:00

atau

72:00:00

FLACS-CFD 128 240GB 0
FLACS-CFD di high-mem node
  • Tambahkan #SBATCH --nodelist=epyc001
128 500GB 0
Keterangan:
  1. Apabila menggunakan skema array:
    • CPU = ntasks * total array
    • RAM = ntasks * total array
  2. Limitasi untuk menjaga kualitas layanan ALELEON Supercomputer.
Keterangan tambahan
  • Untuk akun perseorangan dengan Kredit Core Hour:
    • SLURM akan menahan job apabila:
      • ntasks * time (jam) lebih besar dari sisa CPU Core Hour user.
      • gpus * time (jam) lebih besar dari sisa GPU Hour user.
    • Cek sisa Kredit Core Hour melalui perintah:
$ sausage
3

Menjalankan Job Komputasi

Jalankan job dengan perintah sbatch.

$ sbatch <nama-SLURM-Submit-script>

Contoh menjalankan nama script my_job_submission.sh.

$ sbatch my_job_submission.sh
4A User dapat melihat status jalannya job dengan perintah squeue berikut.
  • Apabila tidak ada output artinya tidak ada job user yang berjalan / antri pada waktu itu.
$ squeue -ul $USER

Berikut adalah daftar STATE (ST) dari squeue yang menunjukkan status berjalannya job:

Daftar STATE squeue SLURM
STATE Kepanjangan Penjelasan
R RUN Job berjalan
PD PENDING Job tertahan, lihat keterangan NODELIST(REASON)
CG COMPLETING Job selesai dan dalam proses clean-up SLURM
CA CANCELED Job dibatalkan oleh user
PR PREEMPETED Job dibatalkan oleh admin EFISON, alasan dikabarkan melalui email
S SUSPENDED Job ditahan oleh admin EFISON
4B

Menghentikan Job Komputasi

Apabila user ingin membatalkan job, gunakan perintah scancel berdasarkan job ID.*Job ID dapat dilihat melalui perintah squeue pada kolom JOBID.

  • User hanya bisa membatalkan job submission milik user sendiri.
$ scancel <job-ID-submission-user>

Contoh user membatalkan job submission milik user dengan ID 231.

$ scancel 231 

Opsi Menggunakan Web EFIRO (EFIRO Job Composer)

Langkah Menjalankan FLACS-CFD di Web EFIRO

Efirojobcomposer3.png

0
Login Web EFIRO
1
Membuka Job Composer dan Memilih Template Job
  • Buka menu Jobs > Jobs Composer pada dashboard EFIRO.
  • Pilih New Job > From Template
Menu Jobs > Jobs Composer
Menu New Jobs > From Template
2 Jcselecttemplate3.png
  • PIlih template FLACS-CFD yang diinginkan.
  • Isi atau ganti kolom Job Name sesuai keinginan user.
  • Apabila sudah selesai, klik Create New Job.
Template FLACS-CFD yang tersedia
Nama Template Penjelasan
FLACS-CFD 21.3 Menjalankan FLACS-CFD 21.3 untuk satu simulasi
FLACS-CFD 21.3 Array Menjalankan FLACS-CFD 21.3 dengan skema array
FLACS-CFD 22.1 Menjalankan FLACS-CFD 22.1 untuk satu simulasi
FLACS-CFD 22.1 Array Menjalankan FLACS-CFD 22.1 dengan skema array
3
Menyiapkan File Komputasi

Jcjoboption3.png

Gunakan menu Edit Files untuk upload file komputasi yang dibutuhkan.

  • Laman Edit Files juga dapat melakukan download / edit / rename / delete file.
  • Fitur upload pada Edit Files mempunyai limit kapasitas 2GB per file.
4
Melengkapi Submit Script

Submit Script adalah "formulir" untuk menjalankan job komputasi user.

  • Lengkapi Submit Script melalui menu Open Editor.
  • Ikuti petunjuk NOTES di dalamnya.
  • Jangan lupa klik Save setiap sekali mengubah script.

Panduan Nilai Maksimal SBATCH
Panduan Nilai Maksimal SBATCH ntasks, mem, gpus, time
Skenario Komputasi (CPU)1 (RAM)1 gpus

(GPU)

time

(time limit)

Fair policy usage untuk akumulasi semua job2 128 128GB 2 3-00:00:00

atau

72:00:00

FLACS-CFD 128 240GB 0
FLACS-CFD di high-mem node
  • Tambahkan #SBATCH --nodelist=epyc001
128 500GB 0
Keterangan:
  1. Apabila menggunakan skema array:
    • CPU = ntasks * total array
    • RAM = ntasks * total array
  2. Limitasi untuk menjaga kualitas layanan ALELEON Supercomputer.
Keterangan tambahan
  • Untuk akun perseorangan dengan Kredit Core Hour:
    • SLURM akan menahan job apabila:
      • ntasks * time (jam) lebih besar dari sisa CPU Core Hour user.
      • gpus * time (jam) lebih besar dari sisa GPU Hour user.
    • Cek sisa Kredit Core Hour melalui menu Open Terminal dan jalankan perintah:
$ sausage

Jcjoboption4.png

5
Menjalankan Job Komputasi

Jalankan job dengan klik tombol Submit.

Penjelasan kolom Status, pantau dengan refresh halaman job
Status Arti
Not Submitted Job belum pernah dijalankan.
Running Job berjalan.
Queue Job mengantri dan belum berjalan.
Langkah melihat status job ketika queue
Buka Jobs > Active Jobs pada dashboard EFIRO.
  • Lakukan langkah sesuai gambar dibawah ini
Halaman Active Jobs. Ubah opsi Your jobs untuk melihat status job user saja. Klik simbol > untuk melihat status job pending pada kolom Reason. Arti reason lihat laman Daftar Reason NODELIST ALELEON Supercomputer.
Completed Job selesai berjalan.
Failed Job berhenti di tengah jalan, bisa karena di Stop atau Delete oleh user.
Menghentikan Job Komputasi

Untuk menghentikan job yang tengah berjalan, klik tombol Stop.

Stop.png

6A
Melihat Output Komputasi

User dapat melihat output file komputasi pada kolom Folder Contents

  • Atau dengan membuka Edit Files
Kolom Folder Contents.
6B User dapat menjalankan ulang ruang job yang sama dengan mengklik kembali tombol Submit.

Notifikasi Status Jalannya Komputasi via email

SLURM ALELEON Supercomputer dapat mengirim notifikasi email kepada user dengan nama "Jojo" untuk mengabarkan status berjalannya job komputasi user. Silahkan tambahan SBATCH berikut pada Submit Script apabila user ingin menerima notifikasi email dari SLURM:

#SBATCH --mail-user=<alamat-email-user> 
#SBATCH --mail-type=BEGIN,END,FAIL

SBATCH mail-type mengatur konten email notifikasi SLURM dengan pilihan opsi yang sekiranya berguna untuk user:

  • BEGIN -> notifikasi job sudah mulai
  • END -> notifikasi job sudah selesai beserta cuplikan 20 baris terakhir dari file SBATCH output dan error.
  • FAIL -> notifikasi apabila job gagal berjalan atau berhenti tidak sewajarnya.
  • TIME_LIMIT_50 -> job telah berjalan dengan durasi waktu 50% time limit.
  • TIME_LIMIT_80 -> job telah berjalan dengan durasi waktu 80% time limit.

Pelaporan Kendala dan Support

Apabila menjumpai masalah teknis dalam menjalankan komputasi, silahkan lapor dengan klik gambar berikut ini.

Wiki-pelaporankendala.jpg

---

Bila terdapat pertanyaan lainnya, silahkan hubungi admin EFISON melalui email:

support@efisonlt.com