|
|
Baris 64: |
Baris 64: |
| *Membuat '''SLURM Submit Script''' yaitu 'formulir' untuk menjalankan job komputasi. | | *Membuat '''SLURM Submit Script''' yaitu 'formulir' untuk menjalankan job komputasi. |
| **Nama script bebas dengan format file .sh (bash), contoh ''<code>my_job_submission.sh</code>'' | | **Nama script bebas dengan format file .sh (bash), contoh ''<code>my_job_submission.sh</code>'' |
| $ mkdir kerjaanskripsi
| |
| $ cd kerjaanskripsi
| |
| $ nano my_job_submission.sh
| |
|
| |
| ''... upload / menyiapkan / edit input dan data komputasi ...''
| |
| |- | | |- |
| | rowspan="2" |'''2''' | | | rowspan="2" |'''2''' |
Baris 315: |
Baris 310: |
| *Buka menu '''<code>Jobs</code>''' > '''<code>Jobs Composer</code>''' pada dashboard EFIRO. | | *Buka menu '''<code>Jobs</code>''' > '''<code>Jobs Composer</code>''' pada dashboard EFIRO. |
| *Pilih '''<code>New Job</code>''' > '''<code>From Template</code>''' | | *Pilih '''<code>New Job</code>''' > '''<code>From Template</code>''' |
| [[Berkas:Efirojobcomposermenu.png|nir|jmpl|Menu '''<code>Jobs</code> > <code>Jobs Composer</code>''']][[Berkas:Jcnewjobmarked.png|al=|nir|jmpl|220x220px|Menu '''<code>New Jobs</code>''' > '''<code>From Template</code>''']] | | [[Berkas:Efirojobcomposermenu.png|nir|jmpl|''Menu '''<code>Jobs</code> > <code>Jobs Composer</code>''''']][[Berkas:Jcnewjobmarked.png|al=|nir|jmpl|220x220px|''Menu '''<code>New Jobs</code>''' > '''<code>From Template</code>''''']] |
| |- | | |- |
| |'''2''' | | |'''2''' |
Baris 459: |
Baris 454: |
| User dapat melihat output file komputasi pada kolom '''<code>Folder Contents</code>''' | | User dapat melihat output file komputasi pada kolom '''<code>Folder Contents</code>''' |
| *Atau dengan membuka '''<code>Edit Files</code>''' | | *Atau dengan membuka '''<code>Edit Files</code>''' |
| [[Berkas:Jcfoldercontentsedit.png|al=|nir|jmpl|Kolom '''<code>Folder Contents</code>'''.]] | | [[Berkas:Jcfoldercontentsedit.png|al=|nir|jmpl|''Kolom '''<code>Folder Contents</code>'''.'']] |
| |- | | |- |
| |'''6B''' | | |'''6B''' |
Revisi per 15 Januari 2024 10.30
NAMD adalah framework dinamika molekular yang digunakan untuk komputasi biomolekuler skala besar di HPC. NAMD mendukung komputasi paralel.
Modul NAMD
Berikut adalah detail versi NAMD yang tersedia secara global di ALELEON Supercomputer:
Modul NAMD versi CPU
Versi
|
Nama modul software
|
Dukungan hardware
|
CPU
|
GPU
|
OMP
Threading
|
MPI
multi-node
|
2.14
|
namd/2.14-GCC10-FFTW3F-UCX
|
V
|
-
|
-
|
V
|
Modul NAMD versi GPU
Versi
|
Nama modul software
|
Dukungan hardware
|
CPU
|
GPU
|
OMP
Threading
|
MPI
multi-node
|
2.14
|
namd/2.14-GCC10-FFTW3F-CUDA11
|
V
|
V
|
-
|
V
|
Menjalankan NAMD
User dapat menjalankan komputasi dengan pilihan cara melalui terminal atau website EFIRO (klik expand atau kembangkan).
Opsi Menggunakan terminal (SLURM sbatch)
Langkah Menjalankan NAMD di Terminal
|
0
|
Login SSH
Tatacara login SSH lihat laman Login SSH ALELEON Supercomputer.
|
1
|
Menyiapkan File Komputasi
Siapkan file yang dibutuhkan untuk komputasi user, rekomendasi dalam satu folder per job:
- File input dan data komputasi.
- User dapat upload / download file ke ALELEON dengan software FTP.
- Membuat SLURM Submit Script yaitu 'formulir' untuk menjalankan job komputasi.
- Nama script bebas dengan format file .sh (bash), contoh
my_job_submission.sh
|
2
|
Template SLURM Submit Script NAMD
Ikuti panduan template berikut dan petunjuk NOTES di dalamnya.
Template SLURM Submit Script untuk NAMD versi CPU
|
#!/bin/bash
# -----------------------------------------------------
# Template SLURM Submit Script
# NAMD (versi CPU) | rev.080124
#
# NOTES:
# 1. Isi bagian yang ditandai 4 garing (////).
# 2. Template ini bersifat referensi.
# User dapat mengubah bagian yang perlu diubah.
# -----------------------------------------------------
# -----------------------------------------------------
# Alokasi komputasi SBATCH, input, dan module
# -----------------------------------------------------
# Alokasi jumlah core thread CPU
#SBATCH --ntasks=////
# Alokasi jumlah memori RAM (satuan GB)
#SBATCH --mem=////GB
# Alokasi limit waktu menjalankan job
# Format HH:MM:SS atau D-HH:MM:SS
#SBATCH --time=////
# Definisi file untuk menampung output terminal program
#SBATCH --output=result-%j.txt
# Definisi file untuk menampung output error log
#SBATCH --error=error-%j.txt
# Nama input file NAMD yang dijalankan
INPUT_FILE="////.conf"
# Memuat modul software NAMD versi CPU
# Daftar modul lihat subbab "Modul NAMD" di atas
module load namd////
# ----------------------------------------------------
# Script jalannya program
# ----------------------------------------------------
# Perintah menjakankan NAMD
mpirun -np ${SLURM_NTASKS} namd2 ${INPUT_FILE}
|
Template SLURM Submit Script untuk NAMD versi GPU
|
#!/bin/bash
# -----------------------------------------------------
# Template SLURM Submit Script
# NAMD (versi GPU) | rev.080124
#
# NOTES:
# 1. Isi bagian yang ditandai 4 garing (////).
# 2. Template ini bersifat referensi.
# User dapat mengubah bagian yang perlu diubah.
# -----------------------------------------------------
# -----------------------------------------------------
# Alokasi komputasi SBATCH, input, dan module
# -----------------------------------------------------
# Menggunakan partisi compute node GPU
#SBATCH --partition=ampere
# Alokasi jumlah core thread CPU
#SBATCH --ntasks=////
# Alokasi jumlah GPU
#SBATCH --gpus=////
# Alokasi jumlah memori RAM (satuan GB)
#SBATCH --mem=////GB
# Alokasi limit waktu menjalankan job
# Format HH:MM:SS atau D-HH:MM:SS
#SBATCH --time=////
# Definisi file untuk menampung output terminal program
#SBATCH --output=result-%j.txt
# Definisi file untuk menampung output error log
#SBATCH --error=error-%j.txt
# Nama input file NAMD yang dijalankan
INPUT_FILE="////.conf"
# Memuat modul software NAMD versi GPU
# Daftar modul lihat subbab "Modul NAMD" di atas
module load namd////
# ----------------------------------------------------
# Script jalannya program
# ----------------------------------------------------
# Perintah menjakankan NAMD
charmrun ++local +p${SLURM_NTASKS} namd2 ${INPUT_FILE}
|
|
Panduan Nilai Maksimal SBATCH untuk NAMD
Panduan Nilai Maksimal SBATCH ntasks, mem, gpus, time
|
Skenario Komputasi
|
ntasks
(CPU)
|
mem
(RAM)
|
gpus
(GPU)
|
time
(time limit)
|
Fair policy usage untuk akumulasi semua job1
|
128
|
128GB
|
2
|
3-00:00:00
atau
72:00:00
|
NAMD versi CPU2
|
384
|
240GB2
|
0
|
NAMD versi CPU di high-mem node
- Tambahkan
#SBATCH --nodelist=epyc001
|
128
|
500GB
|
0
|
NAMD versi GPU
|
32
|
120GB
|
1
|
Keterangan:
- Limitasi untuk menjaga kualitas layanan ALELEON Supercomputer.
- NAMD mendukung komputasi paralel MPI. Ketika jumlah ntasks lebih dari 128:
- SLURM otomatis menjalankan job pada multi-node.
- Parameter mem adalah alokasi memori RAM per-node.
- Info detail buka laman MPI ALELEON Supercomputer.
|
Keterangan tambahan
|
- Untuk akun perseorangan dengan Kredit Core Hour:
- SLURM akan menahan job apabila:
- ntasks * time (jam) lebih besar dari sisa CPU Core Hour user.
- gpus * time (jam) lebih besar dari sisa GPU Hour user.
- Cek sisa Kredit Core Hour melalui perintah:
$ sausage
|
|
3
|
Menjalankan Job Komputasi
Jalankan job dengan perintah sbatch.
$ sbatch <nama-SLURM-Submit-script>
Contoh menjalankan nama script my_job_submission.sh .
$ sbatch my_job_submission.sh
|
4A
|
User dapat melihat status jalannya job dengan perintah squeue berikut.
- Apabila tidak ada output artinya tidak ada job user yang berjalan / antri pada waktu itu.
$ squeue -ul $USER
Berikut adalah daftar STATE (ST) dari squeue yang menunjukkan status berjalannya job:
Daftar STATE squeue SLURM
STATE
|
Kepanjangan
|
Penjelasan
|
R
|
RUN
|
Job berjalan
|
PD
|
PENDING
|
Job tertahan, lihat keterangan NODELIST(REASON)
|
CG
|
COMPLETING
|
Job selesai dan dalam proses clean-up SLURM
|
CA
|
CANCELED
|
Job dibatalkan oleh user
|
PR
|
PREEMPETED
|
Job dibatalkan oleh admin EFISON, alasan dikabarkan melalui email
|
S
|
SUSPENDED
|
Job ditahan oleh admin EFISON
|
|
4B
|
Menghentikan Job Komputasi
Apabila user ingin membatalkan job, gunakan perintah scancel berdasarkan job ID.
- Job ID dapat dilihat melalui perintah squeue pada kolom JOBID.
- User hanya bisa membatalkan job submission milik user sendiri.
$ scancel <job-ID-submission-user>
Contoh user membatalkan job submission milik user dengan ID 231.
$ scancel 231
|
Opsi Menggunakan Web EFIRO (EFIRO Job Composer)
Langkah Menjalankan NAMD di Web EFIRO
|
0
|
Login Web EFIRO
|
1
|
Membuka Job Composer dan Memilih Template Job
- Buka menu
Jobs > Jobs Composer pada dashboard EFIRO.
- Pilih
New Job > From Template
Menu Jobs > Jobs Composer Menu New Jobs > From Template
|
2
|
- PIlih template NAMD yang diinginkan.
- Isi atau ganti kolom
Job Name sesuai keinginan user.
- Apabila sudah selesai, klik
Create New Job .
Template NAMD yang tersedia
|
Nama Template
|
Penjelasan
|
NAMD 2.14 (CPU)
|
Menjalankan NAMD 2.14 pada CPU
|
NAMD 2.14 (GPU)
|
Menjalankan NAMD 2.14 dengan akselerasi GPU.
|
|
3
|
Menyiapkan File Komputasi
Gunakan menu Edit Files untuk upload file komputasi yang dibutuhkan.
- Laman Edit Files juga dapat melakukan download / edit / rename / delete file.
- Fitur upload pada Edit Files mempunyai limit kapasitas 2GB per file.
|
4
|
Melengkapi Submit Script
Submit Script adalah "formulir" untuk menjalankan job komputasi user.
- Lengkapi Submit Script melalui menu
Open Editor .
- Ikuti petunjuk NOTES di dalamnya.
- Jangan lupa klik
Save setiap sekali mengubah script.
|
Panduan Nilai Maksimal SBATCH
Panduan Nilai Maksimal SBATCH ntasks, mem, gpus, time
|
Skenario Komputasi
|
ntasks
(CPU)
|
mem
(RAM)
|
gpus
(GPU)
|
time
(time limit)
|
Fair policy usage untuk akumulasi semua job1
|
128
|
128GB
|
2
|
3-00:00:00
atau
72:00:00
|
NAMD versi CPU2
|
384
|
240GB2
|
0
|
NAMD versi CPU di high-mem node
- Tambahkan
#SBATCH --nodelist=epyc001
|
128
|
500GB
|
0
|
NAMD versi GPU
|
32
|
120GB
|
1
|
Keterangan:
- Limitasi untuk menjaga kualitas layanan ALELEON Supercomputer.
- NAMD mendukung komputasi paralel MPI. Ketika jumlah ntasks lebih dari 128:
- SLURM otomatis menjalankan job pada multi-node.
- Parameter mem adalah alokasi memori RAM per-node.
- Info detail buka laman MPI ALELEON Supercomputer.
|
Keterangan tambahan
|
- Untuk akun perseorangan dengan Kredit Core Hour:
- SLURM akan menahan job apabila:
- ntasks * time (jam) lebih besar dari sisa CPU Core Hour user.
- gpus * time (jam) lebih besar dari sisa GPU Hour user.
- Cek sisa Kredit Core Hour melalui menu
Open Terminal dan jalankan perintah:
$ sausage
|
|
5
|
Menjalankan Job Komputasi
Jalankan job dengan klik tombol Submit .
Penjelasan kolom Status , pantau dengan refresh halaman job
Status
|
Arti
|
Not Submitted
|
Job belum pernah dijalankan.
|
Running
|
Job berjalan.
|
Queue
|
Job mengantri dan belum berjalan.
Langkah melihat status job ketika queue
|
Buka Jobs > Active Jobs pada dashboard EFIRO.
- Lakukan langkah sesuai gambar dibawah ini
|
|
Completed
|
Job selesai berjalan.
|
Failed
|
Job berhenti di tengah jalan, bisa karena di Stop atau Delete oleh user.
|
Menghentikan Job Komputasi
Untuk menghentikan job yang tengah berjalan, klik tombol Stop .
|
6A
|
Melihat Output Komputasi
User dapat melihat output file komputasi pada kolom Folder Contents
- Atau dengan membuka
Edit Files
|
6B
|
User dapat menjalankan ulang ruang job yang sama dengan mengklik kembali tombol Submit .
|
Notifikasi Status Jalannya Komputasi via email
SLURM ALELEON Supercomputer dapat mengirim notifikasi email kepada user dengan nama "Jojo" untuk mengabarkan status berjalannya job komputasi user. Silahkan tambahan SBATCH berikut pada Submit Script apabila user ingin menerima notifikasi email dari SLURM:
#SBATCH --mail-user=<alamat-email-user>
#SBATCH --mail-type=BEGIN,END,FAIL
SBATCH mail-type mengatur konten email notifikasi SLURM dengan pilihan opsi yang sekiranya berguna untuk user:
- BEGIN -> notifikasi job sudah mulai
- END -> notifikasi job sudah selesai beserta cuplikan 20 baris terakhir dari file SBATCH output dan error.
- FAIL -> notifikasi apabila job gagal berjalan atau berhenti tidak sewajarnya.
- TIME_LIMIT_50 -> job telah berjalan dengan durasi waktu 50% time limit.
- TIME_LIMIT_80 -> job telah berjalan dengan durasi waktu 80% time limit.
Pelaporan Kendala dan Support
Apabila menjumpai masalah teknis dalam menjalankan komputasi, silahkan lapor dengan klik gambar berikut ini.
---
Bila terdapat pertanyaan lainnya, silahkan hubungi admin EFISON melalui email:
support@efisonlt.com