LAMMPS: Perbedaan antara revisi

Dari ALELEON by EFISON
(update versi LAMMPS ke 2022.06.23u4)
(overhaul wiki lammps 120124)
Baris 4: Baris 4:


== '''Modul LAMMPS''' ==
== '''Modul LAMMPS''' ==
ALELEON Supercomputer menyediakan LAMMPS yang dapat berjalan di CPU dan dengan akselerasi GPU. Berikut adalah detail versi LAMMPS yang tersedia secara global di ALELEON Supercomputer:
Berikut adalah detail versi LAMMPS yang tersedia secara global di ALELEON Supercomputer:
{| class="wikitable"
{| class="wikitable"
|+Modul LAMMPS versi CPU
|+Modul LAMMPS versi CPU
Baris 29: Baris 29:
|}
|}
{| class="wikitable"
{| class="wikitable"
|+Modul LAMMPS dengan akselerasi GPU
|+Modul LAMMPS versi GPU
! rowspan="2" |Versi
! rowspan="2" |Versi
! rowspan="2" |Nama modul
! rowspan="2" |Nama modul
Baris 56: Baris 56:


[[Berkas:Wiki-pelaporankendala.jpg|1000x1000px|link=https://efisonlt.com/aleleonbugreport]]
[[Berkas:Wiki-pelaporankendala.jpg|1000x1000px|link=https://efisonlt.com/aleleonbugreport]]
== '''Menjalankan LAMMPS di CPU''' ==
=='''Menjalankan LAMMPS'''==
User dapat menjalankan LAMMPS di CPU dengan pilihan cara menjalankan komputasi:  
User dapat menjalankan komputasi dengan pilihan cara melalui terminal atau website EFIRO ''(klik expand atau kembangkan)''.
=== Opsi Menggunakan terminal (SLURM sbatch)===
{| class="wikitable mw-collapsible mw-collapsed"
! colspan="2" |Langkah Menjalankan LAMMPS di Terminal
[[Berkas:Sbatch Terminal.png|nirbing|500x500px]]
|-
|'''0'''
|
=====Login SSH=====
Tatacara login SSH lihat laman [https://wiki.efisonlt.com/wiki/Menggunakan_ALELEON_Supercomputer_via_Terminal#1_|_Login_SSH '''Login SSH ALELEON Supercomputer'''].
|-
|'''1'''
|
===== Menyiapkan File Komputasi=====
Siapkan file yang dibutuhkan untuk komputasi user, rekomendasi dalam satu folder per job:
*File input dan data komputasi.
**User dapat upload / download file ke ALELEON dengan [[Upload File dengan Aplikasi FTP|'''software FTP''']].
*Membuat '''SLURM Submit Script''' yaitu 'formulir' untuk menjalankan job komputasi.
**Nama script bebas dengan format file .sh (bash), contoh ''<code>my_job_submission.sh</code>''
$ mkdir kerjaanskripsi
$ cd kerjaanskripsi
$ nano my_job_submission.sh
''... upload / menyiapkan / edit input dan data komputasi ...''
|-
| rowspan="2" |'''2'''
|
=====Template SLURM Submit Script LAMMPS=====
Ikuti panduan template berikut dan petunjuk NOTES di dalamnya.
{| class="wikitable mw-collapsible mw-collapsed"
!Template SLURM Submit Script untuk LAMMPS versi CPU
|-
|<syntaxhighlight lang="bash" line="1">
#!/bin/bash
 
# -----------------------------------------------------
# Template SLURM Submit Script
# LAMPPS (versi CPU) | rev.080124
#
# NOTES:
# 1. Isi bagian yang ditandai 4 garing (////).
# 2. Template ini bersifat referensi.
#    User dapat mengubah bagian yang perlu diubah.
# -----------------------------------------------------
 
# -----------------------------------------------------
# Alokasi komputasi SBATCH, input, dan module
# -----------------------------------------------------
 
# Alokasi jumlah core thread CPU
#SBATCH --ntasks=////
 
# Alokasi jumlah memori RAM (satuan GB)
#SBATCH --mem=////GB
 
# Alokasi limit waktu menjalankan job
# Format HH:MM:SS atau D-HH:MM:SS
#SBATCH --time=////
 
# Definisi file untuk menampung output terminal program
#SBATCH --output=result-%j.txt
 
# Definisi file untuk menampung output error log   
#SBATCH --error=error-%j.txt 
 
# Nama input file LAMMPS yang dijalankan
INPUT_FILE="////"
 
# Memuat modul software LAMMPS versi CPU
# Daftar modul lihat subbab "Modul LAMMPS" di atas
module load lammps////
 
# ----------------------------------------------------
# Script jalannya program
# ----------------------------------------------------
# Perintah menjalankan LAMMPS
mpirun --np ${SLURM_NTASKS} lmp -in ${INPUT_FILE}
</syntaxhighlight>
|}
Info khusus pada LAMMPS versi GPU untuk menghasilkan performa optimal:
 
* Jumlah ntasks (CPU) gunakan 2 atau 4 per jumlah GPU.
* Rekomendasi gunakan 2 thread OMP (cpus-per-task) untuk kebanyakan komputasi.
** Atau 4 untuk beban komputasi yang dinilai sangat tinggi.
 
{| class="wikitable mw-collapsible mw-collapsed"
!Template SLURM Submit Script untuk LAMMPS versi GPU
|-
|<syntaxhighlight lang="bash" line="1">
#!/bin/bash
 
# -----------------------------------------------------
# Template SLURM Submit Script
# LAMPPS (versi GPU) | rev.080124
#
# NOTES:
# 1. Isi bagian yang ditandai 4 garing (////).
# 2. Template ini bersifat referensi.
#    User dapat mengubah bagian yang perlu diubah.
# 3. Perhatikan rate CCH = ntasks * cpus-per-task.
# -----------------------------------------------------
 
# -----------------------------------------------------
# Alokasi komputasi SBATCH, input, dan module
# -----------------------------------------------------
 
# Menggunakan partisi compute node GPU
#SBATCH --partition=ampere
 
# Alokasi jumlah core thread CPU
# Rekomendasi gunakan 2 atau 4 per jumlah GPU
#SBATCH --ntasks=////
 
# Rekomendasi 2 thread OMP
#SBATCH --cpus-per-task=2
 
# Alokasi jumlah GPU
#SBATCH --gpus=////
 
# Alokasi jumlah memori RAM (satuan GB)
#SBATCH --mem=////GB
 
# Alokasi limit waktu menjalankan job
# Format HH:MM:SS atau D-HH:MM:SS
#SBATCH --time=////
 
# Definisi file untuk menampung output terminal program
#SBATCH --output=result-%j.txt
 
# Definisi file untuk menampung output error log   
#SBATCH --error=error-%j.txt 
 
# Nama input file LAMMPS yang dijalankan
INPUT_FILE="////"
 
# Memuat modul software LAMMPS versi GPU
# Daftar modul lihat subbab "Modul LAMMPS" di atas
module load lammps////
 
# ----------------------------------------------------
# Script jalannya program
# ----------------------------------------------------
 
# Definisi threading OMP
export OMP_NUM_THREADS=${SLURM_CPUS_PER_TASK}
# Perintah menjalankan LAMMPS
mpirun --np ${SLURM_NTASKS} lmp -sf gpu -pk gpu ${SLURM_GPUS} -in ${INPUT_FILE}
</syntaxhighlight>
|}
|-
|=====Panduan Nilai Maksimal SBATCH untuk LAMMPS=====
{| class="wikitable mw-collapsible mw-collapsed"
! colspan="5" |Panduan Nilai Maksimal SBATCH ntasks, mem, gpus, time
|-
!Skenario Komputasi
!ntasks
(CPU)
!mem
(RAM)
!gpus
(GPU)
!time
(time limit)
|-
|Fair policy usage untuk akumulasi semua job<sup>''1''</sup>
|128
|128GB
|2
| rowspan="4" |3-00:00:00
atau


===[[Menggunakan ALELEON Supercomputer via EFIRO#3A - Menjalankan Komputasi ke Compute Node via Job Composer|EFIRO Job Composer]]===
72:00:00
Menjalankan komputasi dengan tampilan grafis pada formulir job submission EFIRO Job Composer. Berikut adalah pilihan template LAMMPS versi CPU yang tersedia:
|-
|LAMMPS versi CPU''<sup>2</sup>''
| 384
|240GB''<sup>2</sup>''
|0
|-
|LAMMPS versi CPU di high-mem node
*Tambahkan <code>#SBATCH --nodelist=epyc001</code>
|128
|500GB
|0
|-
|LAMMPS versi GPU''<sup>3</sup>''
|32''<sup>3</sup>''
|120GB
|2
|-
| colspan="5" |'''''Keterangan:'''''# Limitasi untuk menjaga kualitas layanan ALELEON Supercomputer.#*User dapat mengajukan permintaan buka limitasi apabila butuh alokasi lebih.
#* Info detail buka laman [[Limitasi Fair Usage ALELEON Supercomputer|'''Limitasi Fair Usage ALELEON Supercomputer''']]
#LAMMPS mendukung komputasi paralel MPI. Ketika jumlah ntasks lebih dari 128:#* SLURM otomatis menjalankan job pada multi-node.
#*Parameter mem adalah alokasi memori RAM per-node.
#*Info detail buka laman [[MPI ALELEON Supercomputer|'''MPI ALELEON Supercomputer''']].
#Jumlah CPU pada LAMMPS versi GPU = ntasks*cpus-per-task
|-
! colspan="5" |Keterangan tambahan
|-
| colspan="5" |
*'''Untuk akun perseorangan dengan Kredit Core Hour:'''
**SLURM akan menahan job apabila:
***ntasks * time (jam) lebih besar dari sisa CPU Core Hour user.
***gpus * time (jam) lebih besar dari sisa GPU Hour user.
**Cek sisa Kredit Core Hour melalui perintah:
$ '''sausage'''
*Info SBATCH lebih detail lihat laman [[Submit Script ALELEON Supercomputer|'''Submit Script ALELEON Supercomputer''']]
|}
|-
| '''3'''
|
=====Menjalankan Job Komputasi=====
Jalankan job dengan perintah sbatch.
$ '''sbatch''' '''''<nama-SLURM-Submit-script>'''''
Contoh menjalankan nama script <code>my_job_submission.sh</code>.
$ sbatch my_job_submission.sh
|-
|'''4A'''
|User dapat melihat status jalannya job dengan perintah squeue berikut.
*Apabila tidak ada output artinya tidak ada job user yang berjalan / antri pada waktu itu.
$ '''squeue -ul $USER'''
Berikut adalah daftar STATE (ST) dari squeue yang menunjukkan status berjalannya job:
{| class="wikitable"
|+Daftar STATE squeue SLURM
!STATE
!Kepanjangan
!Penjelasan
|-
|R
|RUN
|Job berjalan
|-
|PD
|PENDING
| Job tertahan, lihat keterangan [[Daftar Reason NODELIST ALELEON Supercomputer|'''NODELIST(REASON)''']]
|-
|CG
|COMPLETING
|Job selesai dan dalam proses clean-up SLURM
|-
|CA
|CANCELED
|Job dibatalkan oleh user
|-
|PR
|PREEMPETED
|Job dibatalkan oleh admin EFISON, alasan dikabarkan melalui email
|-
|S
|SUSPENDED
|Job ditahan oleh admin EFISON
|}
|-
|'''4B'''
|=====Menghentikan Job Komputasi=====
Apabila user ingin membatalkan job, gunakan perintah scancel berdasarkan job ID.*Job ID dapat dilihat melalui perintah squeue pada kolom JOBID.
* User hanya bisa membatalkan job submission milik user sendiri.
$ '''scancel <''job-ID-submission-user''>'''
Contoh user membatalkan job submission milik user dengan ID 231.
$ scancel 231
|}
===Opsi Menggunakan Web EFIRO (EFIRO Job Composer) ===
{| class="wikitable mw-collapsible mw-collapsed"
! colspan="2" | Langkah Menjalankan LAMMPS di Web EFIRO
[[Berkas:Efirojobcomposer3.png|nirbing|500x500px]]
|-
|'''0'''
|
=====Login Web EFIRO=====
*[[Koneksi VPN ALELEON Supercomputer|'''User harus terhubung ke jaringan VPN ALELEON Supercomputer''']].
*Buka alamat web '''<code><nowiki>http://aleleon.ood</nowiki></code>'''  lalu masukkan username dan password user.
**Bagi user Linux, buka alamat <code>'''<nowiki>http://10.192.50.11</nowiki>'''</code>
|-
| '''1'''
|
=====Membuka Job Composer dan Memilih Template Job=====
*Buka menu '''<code>Jobs</code>''' > '''<code>Jobs Composer</code>''' pada dashboard EFIRO.
*Pilih '''<code>New Job</code>''' > '''<code>From Template</code>'''
[[Berkas:Efirojobcomposermenu.png|nir|jmpl|Menu '''<code>Jobs</code> > <code>Jobs Composer</code>''']][[Berkas:Jcnewjobmarked.png|al=|nir|jmpl|220x220px|Menu '''<code>New Jobs</code>''' > '''<code>From Template</code>''']]
|-
|'''2'''
|[[Berkas:Jcselecttemplate3.png|nirbing|600x600px]]
*PIlih template LAMMPS yang diinginkan.
*Isi atau ganti kolom '''<code>Job Name</code>''' sesuai keinginan user.
*Apabila sudah selesai, klik '''<code>Create New Job</code>'''.
{| class="wikitable"
{| class="wikitable"
|+Template Job Composer LAMMPS versi CPU
! colspan="2" |Template LAMMPS yang tersedia
|-
!Nama Template
!Nama Template
!Penjelasan
!Penjelasan
|-
|-
|LAMMPS 2022.06.23 update 4 (CPU)
|LAMMPS 2022.06.23 update 4 (CPU)
|Menjalankan LAMMPS versi 2022.06.23 update 4 di CPU
|Menjalankan LAMMPS 2022.06.23u4 pada CPU
|-
|LAMMPS 2022.06.23 update 4 (GPU)
|Menjalankan LAMMPS 2022.06.23u4 pada GPU
|}
|}
===[[Menggunakan ALELEON Supercomputer via Terminal#3 - Menjalankan Komputasi ke Compute Node via SLURM|SLURM sbatch via Terminal]]===
Menjalankan komputasi pada terminal melalui job submission SLURM sbatch. Berikut adalah contoh referensi Submit Script untuk menjalankan LAMMPS di CPU. Perhatikan nama modul mengacu versi LAMMPS yang akan digunakan.
{| class="wikitable mw-collapsible"
!Contoh SLURM Submit Script LAMMPS versi CPU
|-
|-
|'''3'''
|
=====Menyiapkan File Komputasi=====
[[Berkas:Jcjoboption3.png|nirbing|600x600px]]
Gunakan menu <code>'''Edit Files'''</code> untuk upload file komputasi yang dibutuhkan.
*Laman Edit Files juga dapat melakukan download / edit / rename / delete file.
*Fitur upload pada Edit Files mempunyai limit kapasitas '''2GB per file'''.
**Gunakan [[Upload File dengan Aplikasi FTP|'''aplikasi FTP''']] untuk upload file tunggal diatas 2GB.
|-
| rowspan="2" |'''4'''
|
|
#!/bin/bash
=====Melengkapi Submit Script=====
Submit Script adalah "formulir" untuk menjalankan job komputasi user.
# ------------------------------------------------------------------------
*Lengkapi Submit Script melalui menu '''<code>Open Editor</code>'''.
# | Template SLURM Submit Script
*Ikuti petunjuk NOTES di dalamnya.
# | Software       : LAMMPS
*Jangan lupa klik <code>'''Save'''</code> setiap sekali mengubah script.
# | Versi           : tergantung input user
[[Berkas:Jceditor3.png|al=|nirbing|500x500px]]
# | Update script   : 07/03/2023
# |
# | NOTES:
# | 1. Isi bagian yang ditandai 4 garing (////).
# | 2. Template ini adalah referensi - user dapat mengubah bagian yang
# |    sekiranya perlu diubah.
# | 3. Panduan mengisi alokasi komputasi (SBATCH) menurut spesifikasi
# |    ALELEON Supercomputer lihat:
# |    <nowiki>https://wiki.efisonlt.com/wiki/Submit_Script_ALELEON_Supercomputer</nowiki>
# ------------------------------------------------------------------------
# --------------------------------------------------
# Alokasi komputasi, modul software, dan file input
# --------------------------------------------------
# Alokasi jumlah compute node
#SBATCH --nodes=////
# Alokasi jumlah core thread CPU
#SBATCH --ntasks=////
# Alokasi jumlah memori RAM (satuan GB)
#SBATCH --mem=////GB
# Alokasi limit waktu menjalankan job
#SBATCH --time=////
# Definisi file untuk menampung output terminal
#SBATCH --output=result-%j.txt
# Definisi file untuk menampung output error log   
#SBATCH --error=error-%j.txt 
# Nama input file LAMMPS dengan format file-nya
INPUT_FILE='////'
# Memuat modul software LAMMPS versi CPU
module load lammps////
# DAFTAR MODUL LAMMPS versi CPU:  
# -------------------------------------------------------------------------
# | Nama modul                                    | Versi LAMMPS          |
# -------------------------------------------------------------------------
# | lammps/2022.06.23u4-GCC11.3-AOCL4.0-CUDA12.1  | 2022.06.23 update 4  |
# -------------------------------------------------------------------------
# -------------------------------------------------
# RUN SCRIPT
# -------------------------------------------------
 
# Perintah menjalankan LAMMPS
mpirun --mca pml ucx --mca osc ucx --np $SLURM_NTASKS lmp -in $INPUT_FILE
|}


== '''Menjalankan LAMMPS dengan Akselerasi GPU''' ==
'''Info khusus pada LAMMPS versi GPU untuk menghasilkan performa optimal:'''
Terdapat beberapa hal khusus dan rekomendasi yang harus diperhatikan ketika menjalankan LAMMPS dengan akselerasi GPU untuk menghasilkan performa optimal yaitu:  


* '''Menggunakan 2 atau 4 core thread CPU per jumlah GPU.'''
* Jumlah ntasks (CPU) gunakan 2 atau 4 per jumlah GPU.
* '''Menggunakan threading OpenMP (OMP; OMP_NUM_THREAD) dengan jumlah 2''' untuk kebanyakan komputasi.
* Rekomendasi gunakan 2 thread OMP (cpus-per-task) untuk kebanyakan komputasi.
** Atau gunakan jumlah 4 untuk beban komputasi yang besar.
** Atau 4 untuk beban komputasi yang dinilai sangat tinggi.
|-
|
=====Panduan Nilai Maksimal SBATCH=====
{| class="wikitable mw-collapsible mw-collapsed"
! colspan="5" |Panduan Nilai Maksimal SBATCH ntasks, mem, gpus, time
|-
!Skenario Komputasi
!ntasks
(CPU)
!mem
(RAM)
!gpus
(GPU)
!time
(time limit)
|-
|Fair policy usage untuk akumulasi semua job<sup>''1''</sup>
|128
|128GB
|2
| rowspan="4" |3-00:00:00
atau


Berikutnya user dapat menjalankan LAMMPS dengan pilihan:
72:00:00
|-
|LAMMPS versi CPU''<sup>2</sup>''
|384
|240GB''<sup>2</sup>''
|0
|-
|LAMMPS versi CPU di high-mem node
*Tambahkan <code>#SBATCH --nodelist=epyc001</code>
|128
|500GB
|0
|-
|LAMMPS versi GPU''<sup>3</sup>''
|32''<sup>3</sup>''
|120GB
|2
|-
| colspan="5" |'''''Keterangan:'''''# Limitasi untuk menjaga kualitas layanan ALELEON Supercomputer.#*User dapat mengajukan permintaan buka limitasi apabila butuh alokasi lebih.
#* Info detail buka laman [[Limitasi Fair Usage ALELEON Supercomputer|'''Limitasi Fair Usage ALELEON Supercomputer''']]
#LAMMPS mendukung komputasi paralel MPI. Ketika jumlah ntasks lebih dari 128:#* SLURM otomatis menjalankan job pada multi-node.
#*Parameter mem adalah alokasi memori RAM per-node.
#*Info detail buka laman [[MPI ALELEON Supercomputer|'''MPI ALELEON Supercomputer''']].
#Jumlah CPU pada LAMMPS versi GPU = ntasks*cpus-per-task
|-
! colspan="5" |Keterangan tambahan
|-
| colspan="5" |
*'''Untuk akun perseorangan dengan Kredit Core Hour:'''
**SLURM akan menahan job apabila:
***ntasks * time (jam) lebih besar dari sisa CPU Core Hour user.
***gpus * time (jam) lebih besar dari sisa GPU Hour user.
**Cek sisa Kredit Core Hour melalui menu '''<code>Open Terminal</code>''' dan jalankan perintah:
$ '''sausage'''
[[Berkas:Jcjoboption4.png|nirbing|600x600px]]
*Info SBATCH lebih detail lihat laman [[Submit Script ALELEON Supercomputer|'''Submit Script ALELEON Supercomputer''']]
|}
|-
|'''5'''
|
=====Menjalankan Job Komputasi=====
Jalankan job dengan klik tombol '''<code>Submit</code>'''.


===[[Menggunakan ALELEON Supercomputer via EFIRO#3A - Menjalankan Komputasi ke Compute Node via Job Composer|EFIRO Job Composer]]===
[[Berkas:Jcsubmit2.png|al=|nirbing|600x600px]]
Menjalankan komputasi dengan tampilan grafis pada formulir job submission EFIRO Job Composer. Berikut adalah pilihan template LAMMPS versi akselerasi GPU yang tersedia:
{| class="wikitable"
{| class="wikitable"
|+Template Job Composer LAMMPS versi GPU
|+''Penjelasan kolom '''<code>Status</code>,''' pantau dengan refresh halaman job''
!Nama Template
!Status
!Penjelasan
!Arti
|-
|Not Submitted
|Job belum pernah dijalankan.
|-
|Running
|Job berjalan.
|-
|Queue
|Job mengantri dan belum berjalan.
{| class="wikitable mw-collapsible mw-collapsed"
!Langkah melihat status job ketika queue
|-
|Buka <code>'''Jobs > Active Jobs'''</code> pada dashboard EFIRO.
*Lakukan langkah sesuai gambar dibawah ini
[[Berkas:Efiroqueueedit.png|al=|jmpl|''Halaman Active Jobs. Ubah opsi '''<code>Your jobs</code>''' untuk melihat status job user saja. Klik simbol '''>''' untuk melihat status  job pending pada kolom '''Reason'''. Arti reason lihat laman '''[[Daftar Reason NODELIST ALELEON Supercomputer]].'''''|kiri]]
|}
|-
|Completed
|Job selesai berjalan.
|-
|-
|LAMMPS 2022.06.23 update 4 (GPU)
|Failed
|Menjalankan LAMMPS versi 2022.06.23 update 4 dengan akselerasi GPU
|Job berhenti di tengah jalan, bisa karena di Stop atau Delete oleh user.
|}
|}
===[[Menggunakan ALELEON Supercomputer via Terminal#3 - Menjalankan Komputasi ke Compute Node via SLURM|SLURM sbatch via Terminal]]===
=====Menghentikan Job Komputasi=====
Berikut adalah contoh referensi Submit Script untuk menjalankan LAMMPS dengan akselerasi GPU. Perhatikan nama modul mengacu versi LAMMPS yang akan digunakan.
Untuk menghentikan job yang tengah berjalan, klik tombol '''<code>Stop</code>'''.
{| class="wikitable mw-collapsible"
 
!Contoh SLURM Submit Script LAMMPS dengan akselerasi GPU
[[Berkas:Stop.png|nirbing|600x600px]]
|-
|-
|'''6A'''
|
|
#!/bin/bash
=====Melihat Output Komputasi=====
 
User dapat melihat output file komputasi pada kolom '''<code>Folder Contents</code>'''
# ------------------------------------------------------------------------
*Atau dengan membuka '''<code>Edit Files</code>'''
# | Template SLURM Submit Script
[[Berkas:Jcfoldercontentsedit.png|al=|nir|jmpl|Kolom '''<code>Folder Contents</code>'''.]]
# | Software       : LAMMPS
|-
# | Versi           : tergantung input user
|'''6B'''
# | Update script   : 07/03/2023
|User dapat '''menjalankan ulang ruang job yang sama''' dengan mengklik kembali tombol '''<code>Submit</code>'''.
# |
# | NOTES:
# | 1. Isi bagian yang ditandai 4 garing (////).
# | 2. Template ini adalah referensi - user dapat mengubah bagian yang
# |    sekiranya perlu diubah.
# | 3. Panduan mengisi alokasi komputasi (SBATCH) menurut spesifikasi
# |    ALELEON Supercomputer lihat:
# |    <nowiki>https://wiki.efisonlt.com/wiki/Submit_Script_ALELEON_Supercomputer</nowiki>
# ------------------------------------------------------------------------
# --------------------------------------------------
# Alokasi komputasi, modul software, dan file input
# --------------------------------------------------
# Partisi compute node GPU
#SBATCH --partition=ampere
# Alokasi jumlah GPU
#SBATCH --gpus=////
# Alokasi jumlah core thread CPU
#SBATCH --ntasks=////
# Rekomendasi 2 thread OMP secara umum
#SBATCH --cpus-per-task=2
# Alokasi jumlah memori RAM (satuan GB)
#SBATCH --mem=////GB
# Alokasi limit waktu menjalankan job
#SBATCH --time=////
# Definisi file untuk menampung output terminal
#SBATCH --output=result-%j.txt
# Definisi file untuk menampung output error log   
#SBATCH --error=error-%j.txt 
# Nama input file LAMMPS dengan format file-nya
INPUT_FILE='////'  
# Memuat modul software LAMMPS versi GPU
module load lammps////
# DAFTAR MODUL LAMMPS versi GPU:  
# -------------------------------------------------------------------------
# | Nama modul                                    | Versi LAMMPS          |  
# -------------------------------------------------------------------------
# | lammps/2022.06.23u4-GCC11.3-AOCL4.0-CUDA12.1  | 2022.06.23 update 4  |
# -------------------------------------------------------------------------
# -------------------------------------------------
# RUN SCRIPT
# -------------------------------------------------
# Export threading OMP
export OMP_NUM_THREADS=$SLURM_CPUS_PER_TASK
# Perintah menjalankan LAMMPS
mpirun --mca pml ucx --mca osc ucx --np $SLURM_NTASKS lmp -sf gpu -pk gpu $SLURM_GPUS -in $INPUT_FILE
|}
|}
=='''Notifikasi Status Jalannya Job Submission via email'''==
=='''Notifikasi Status Jalannya Komputasi via email'''==
SLURM ALELEON Supercomputer dapat mengirim notifikasi email kepada user '''untuk mengabarkan apabila job user sudah berjalan atau selesai'''. SLURM ALELEON Supercomputer menggunakan nama email '''Jojo''' untuk mengirim notifikasi email.
SLURM ALELEON Supercomputer dapat mengirim notifikasi email kepada user dengan nama "Jojo" untuk mengabarkan status berjalannya job komputasi user. Silahkan tambahan SBATCH berikut pada Submit Script apabila user ingin menerima notifikasi email dari SLURM:<syntaxhighlight lang="bash">
#SBATCH --mail-user=<alamat-email-user>
#SBATCH --mail-type=BEGIN,END,FAIL
</syntaxhighlight>SBATCH mail-type mengatur konten email notifikasi SLURM dengan pilihan opsi yang sekiranya berguna untuk user:
*BEGIN -> notifikasi job sudah mulai
*END -> notifikasi job sudah selesai beserta cuplikan 20 baris terakhir dari file SBATCH output dan error.
*FAIL -> notifikasi apabila job gagal berjalan atau berhenti tidak sewajarnya.
*TIME_LIMIT_50 -> job telah berjalan dengan durasi waktu 50% time limit.
*TIME_LIMIT_80 -> job telah berjalan dengan durasi waktu 80% time limit.
=='''Pelaporan Kendala dan Support'''==
Apabila menjumpai masalah teknis dalam menjalankan komputasi, silahkan lapor dengan klik gambar berikut ini.
 
[[Berkas:Wiki-pelaporankendala.jpg|1000x1000px|link=https://efisonlt.com/aleleonbugreport]]
 
---


Silahkan tambahan SBATCH berikut pada SLURM Submit Script (dapat ditambahkan setelah SBATCH error) apabila user ingin menerima notifikasi email dari SLURM:
Bila terdapat pertanyaan lainnya, silahkan hubungi admin EFISON melalui email:
  #SBATCH --mail-user=<''alamat-email-user''>
  '''support@efisonlt.com'''
#SBATCH --mail-type=begin
#SBATCH --mail-type=end
*'''mail-user'''
**Alamat email user untuk menerima notifikasi SLURM
*'''mail-type=begin'''
** Notifikasi email yang menginfokan job sudah berjalan.
*'''mail-type=end'''
**Notifikasi email yang menginfokan job sudah selesai.
**Sekaligus memberikan cuplikan 20 baris terakhir dari file output SBATCH output dan error job user.

Revisi per 12 Januari 2024 07.04

Lammps-logo.png

LAMMPS (Large-scale Atomic/Molecular Massively Parallel Simulator) adalah framework molekular dinamik untuk pemodelan material (material modelling). LAMMPS adalah software open-source di bawah lisensi GPL v2.

Modul LAMMPS

Berikut adalah detail versi LAMMPS yang tersedia secara global di ALELEON Supercomputer:

Modul LAMMPS versi CPU
Versi Nama modul Modul

DEFAULT

Dukungan hardware
CPU GPU OMP

Threading

MPI

multi-node

2022.06.23 update 4 lammps/2022.06.23u4-GCC11.3-AOCL4.0-CUDA12.1 V V V V V
Modul LAMMPS versi GPU
Versi Nama modul Modul

DEFAULT

Dukungan hardware
CPU GPU OMP

Threading

MPI

multi-node

2022.06.23 update 4 lammps/2022.06.23u4-GCC11.3-AOCL4.0-CUDA12.1 V V V V V

Permintaan Instalasi Package LAMMPS

Apabila user menjumpai error package LAMMPS yang hilang (missing package), silahkan lapor ke admin lengkap dengan nama package yang dibutuhkan supaya dapat dilakukan proses instalasinya melalui:

Wiki-pelaporankendala.jpg

Menjalankan LAMMPS

User dapat menjalankan komputasi dengan pilihan cara melalui terminal atau website EFIRO (klik expand atau kembangkan).

Opsi Menggunakan terminal (SLURM sbatch)

Langkah Menjalankan LAMMPS di Terminal

Sbatch Terminal.png

0
Login SSH

Tatacara login SSH lihat laman Login SSH ALELEON Supercomputer.

1
Menyiapkan File Komputasi

Siapkan file yang dibutuhkan untuk komputasi user, rekomendasi dalam satu folder per job:

  • File input dan data komputasi.
    • User dapat upload / download file ke ALELEON dengan software FTP.
  • Membuat SLURM Submit Script yaitu 'formulir' untuk menjalankan job komputasi.
    • Nama script bebas dengan format file .sh (bash), contoh my_job_submission.sh
$ mkdir kerjaanskripsi
$ cd kerjaanskripsi
$ nano my_job_submission.sh

... upload / menyiapkan / edit input dan data komputasi ...
2
Template SLURM Submit Script LAMMPS

Ikuti panduan template berikut dan petunjuk NOTES di dalamnya.

Template SLURM Submit Script untuk LAMMPS versi CPU
#!/bin/bash

# -----------------------------------------------------
# Template SLURM Submit Script
# LAMPPS (versi CPU) | rev.080124
# 
# NOTES: 
# 1. Isi bagian yang ditandai 4 garing (////).
# 2. Template ini bersifat referensi.
#    User dapat mengubah bagian yang perlu diubah.
# -----------------------------------------------------

# -----------------------------------------------------
# Alokasi komputasi SBATCH, input, dan module
# -----------------------------------------------------

# Alokasi jumlah core thread CPU
#SBATCH --ntasks=////

# Alokasi jumlah memori RAM (satuan GB)
#SBATCH --mem=////GB

# Alokasi limit waktu menjalankan job
# Format HH:MM:SS atau D-HH:MM:SS
#SBATCH --time=////

# Definisi file untuk menampung output terminal program
#SBATCH --output=result-%j.txt

# Definisi file untuk menampung output error log    
#SBATCH --error=error-%j.txt  

# Nama input file LAMMPS yang dijalankan
INPUT_FILE="////"

# Memuat modul software LAMMPS versi CPU
# Daftar modul lihat subbab "Modul LAMMPS" di atas 
module load lammps////

# ----------------------------------------------------
# Script jalannya program
# ----------------------------------------------------
 
# Perintah menjalankan LAMMPS
mpirun --np ${SLURM_NTASKS} lmp -in ${INPUT_FILE}

Info khusus pada LAMMPS versi GPU untuk menghasilkan performa optimal:

  • Jumlah ntasks (CPU) gunakan 2 atau 4 per jumlah GPU.
  • Rekomendasi gunakan 2 thread OMP (cpus-per-task) untuk kebanyakan komputasi.
    • Atau 4 untuk beban komputasi yang dinilai sangat tinggi.
Template SLURM Submit Script untuk LAMMPS versi GPU
#!/bin/bash

# -----------------------------------------------------
# Template SLURM Submit Script
# LAMPPS (versi GPU) | rev.080124
# 
# NOTES: 
# 1. Isi bagian yang ditandai 4 garing (////).
# 2. Template ini bersifat referensi.
#    User dapat mengubah bagian yang perlu diubah.
# 3. Perhatikan rate CCH = ntasks * cpus-per-task.
# -----------------------------------------------------

# -----------------------------------------------------
# Alokasi komputasi SBATCH, input, dan module
# -----------------------------------------------------

# Menggunakan partisi compute node GPU
#SBATCH --partition=ampere

# Alokasi jumlah core thread CPU
# Rekomendasi gunakan 2 atau 4 per jumlah GPU 
#SBATCH --ntasks=////

# Rekomendasi 2 thread OMP
#SBATCH --cpus-per-task=2

# Alokasi jumlah GPU
#SBATCH --gpus=////

# Alokasi jumlah memori RAM (satuan GB)
#SBATCH --mem=////GB

# Alokasi limit waktu menjalankan job
# Format HH:MM:SS atau D-HH:MM:SS
#SBATCH --time=////

# Definisi file untuk menampung output terminal program
#SBATCH --output=result-%j.txt

# Definisi file untuk menampung output error log    
#SBATCH --error=error-%j.txt  

# Nama input file LAMMPS yang dijalankan
INPUT_FILE="////"

# Memuat modul software LAMMPS versi GPU
# Daftar modul lihat subbab "Modul LAMMPS" di atas 
module load lammps////

# ----------------------------------------------------
# Script jalannya program
# ----------------------------------------------------

# Definisi threading OMP 
export OMP_NUM_THREADS=${SLURM_CPUS_PER_TASK}
 
# Perintah menjalankan LAMMPS
mpirun --np ${SLURM_NTASKS} lmp -sf gpu -pk gpu ${SLURM_GPUS} -in ${INPUT_FILE}
=====Panduan Nilai Maksimal SBATCH untuk LAMMPS=====
Panduan Nilai Maksimal SBATCH ntasks, mem, gpus, time
Skenario Komputasi ntasks

(CPU)

mem

(RAM)

gpus

(GPU)

time

(time limit)

Fair policy usage untuk akumulasi semua job1 128 128GB 2 3-00:00:00

atau

72:00:00

LAMMPS versi CPU2 384 240GB2 0
LAMMPS versi CPU di high-mem node
  • Tambahkan #SBATCH --nodelist=epyc001
128 500GB 0
LAMMPS versi GPU3 323 120GB 2
Keterangan:# Limitasi untuk menjaga kualitas layanan ALELEON Supercomputer.#*User dapat mengajukan permintaan buka limitasi apabila butuh alokasi lebih.
  1. LAMMPS mendukung komputasi paralel MPI. Ketika jumlah ntasks lebih dari 128:#* SLURM otomatis menjalankan job pada multi-node.
  2. Jumlah CPU pada LAMMPS versi GPU = ntasks*cpus-per-task
Keterangan tambahan
  • Untuk akun perseorangan dengan Kredit Core Hour:
    • SLURM akan menahan job apabila:
      • ntasks * time (jam) lebih besar dari sisa CPU Core Hour user.
      • gpus * time (jam) lebih besar dari sisa GPU Hour user.
    • Cek sisa Kredit Core Hour melalui perintah:
$ sausage
3
Menjalankan Job Komputasi

Jalankan job dengan perintah sbatch.

$ sbatch <nama-SLURM-Submit-script>

Contoh menjalankan nama script my_job_submission.sh.

$ sbatch my_job_submission.sh
4A User dapat melihat status jalannya job dengan perintah squeue berikut.
  • Apabila tidak ada output artinya tidak ada job user yang berjalan / antri pada waktu itu.
$ squeue -ul $USER

Berikut adalah daftar STATE (ST) dari squeue yang menunjukkan status berjalannya job:

Daftar STATE squeue SLURM
STATE Kepanjangan Penjelasan
R RUN Job berjalan
PD PENDING Job tertahan, lihat keterangan NODELIST(REASON)
CG COMPLETING Job selesai dan dalam proses clean-up SLURM
CA CANCELED Job dibatalkan oleh user
PR PREEMPETED Job dibatalkan oleh admin EFISON, alasan dikabarkan melalui email
S SUSPENDED Job ditahan oleh admin EFISON
4B =====Menghentikan Job Komputasi=====

Apabila user ingin membatalkan job, gunakan perintah scancel berdasarkan job ID.*Job ID dapat dilihat melalui perintah squeue pada kolom JOBID.

  • User hanya bisa membatalkan job submission milik user sendiri.
$ scancel <job-ID-submission-user>

Contoh user membatalkan job submission milik user dengan ID 231.

$ scancel 231

Opsi Menggunakan Web EFIRO (EFIRO Job Composer)

Langkah Menjalankan LAMMPS di Web EFIRO

Efirojobcomposer3.png

0
Login Web EFIRO
1
Membuka Job Composer dan Memilih Template Job
  • Buka menu Jobs > Jobs Composer pada dashboard EFIRO.
  • Pilih New Job > From Template
Menu Jobs > Jobs Composer
Menu New Jobs > From Template
2 Jcselecttemplate3.png
  • PIlih template LAMMPS yang diinginkan.
  • Isi atau ganti kolom Job Name sesuai keinginan user.
  • Apabila sudah selesai, klik Create New Job.
Template LAMMPS yang tersedia
Nama Template Penjelasan
LAMMPS 2022.06.23 update 4 (CPU) Menjalankan LAMMPS 2022.06.23u4 pada CPU
LAMMPS 2022.06.23 update 4 (GPU) Menjalankan LAMMPS 2022.06.23u4 pada GPU
3
Menyiapkan File Komputasi

Jcjoboption3.png

Gunakan menu Edit Files untuk upload file komputasi yang dibutuhkan.

  • Laman Edit Files juga dapat melakukan download / edit / rename / delete file.
  • Fitur upload pada Edit Files mempunyai limit kapasitas 2GB per file.
4
Melengkapi Submit Script

Submit Script adalah "formulir" untuk menjalankan job komputasi user.

  • Lengkapi Submit Script melalui menu Open Editor.
  • Ikuti petunjuk NOTES di dalamnya.
  • Jangan lupa klik Save setiap sekali mengubah script.

Info khusus pada LAMMPS versi GPU untuk menghasilkan performa optimal:

  • Jumlah ntasks (CPU) gunakan 2 atau 4 per jumlah GPU.
  • Rekomendasi gunakan 2 thread OMP (cpus-per-task) untuk kebanyakan komputasi.
    • Atau 4 untuk beban komputasi yang dinilai sangat tinggi.
Panduan Nilai Maksimal SBATCH
Panduan Nilai Maksimal SBATCH ntasks, mem, gpus, time
Skenario Komputasi ntasks

(CPU)

mem

(RAM)

gpus

(GPU)

time

(time limit)

Fair policy usage untuk akumulasi semua job1 128 128GB 2 3-00:00:00

atau

72:00:00

LAMMPS versi CPU2 384 240GB2 0
LAMMPS versi CPU di high-mem node
  • Tambahkan #SBATCH --nodelist=epyc001
128 500GB 0
LAMMPS versi GPU3 323 120GB 2
Keterangan:# Limitasi untuk menjaga kualitas layanan ALELEON Supercomputer.#*User dapat mengajukan permintaan buka limitasi apabila butuh alokasi lebih.
  1. LAMMPS mendukung komputasi paralel MPI. Ketika jumlah ntasks lebih dari 128:#* SLURM otomatis menjalankan job pada multi-node.
  2. Jumlah CPU pada LAMMPS versi GPU = ntasks*cpus-per-task
Keterangan tambahan
  • Untuk akun perseorangan dengan Kredit Core Hour:
    • SLURM akan menahan job apabila:
      • ntasks * time (jam) lebih besar dari sisa CPU Core Hour user.
      • gpus * time (jam) lebih besar dari sisa GPU Hour user.
    • Cek sisa Kredit Core Hour melalui menu Open Terminal dan jalankan perintah:
$ sausage

Jcjoboption4.png

5
Menjalankan Job Komputasi

Jalankan job dengan klik tombol Submit.

Penjelasan kolom Status, pantau dengan refresh halaman job
Status Arti
Not Submitted Job belum pernah dijalankan.
Running Job berjalan.
Queue Job mengantri dan belum berjalan.
Langkah melihat status job ketika queue
Buka Jobs > Active Jobs pada dashboard EFIRO.
  • Lakukan langkah sesuai gambar dibawah ini
Halaman Active Jobs. Ubah opsi Your jobs untuk melihat status job user saja. Klik simbol > untuk melihat status job pending pada kolom Reason. Arti reason lihat laman Daftar Reason NODELIST ALELEON Supercomputer.
Completed Job selesai berjalan.
Failed Job berhenti di tengah jalan, bisa karena di Stop atau Delete oleh user.
Menghentikan Job Komputasi

Untuk menghentikan job yang tengah berjalan, klik tombol Stop.

Stop.png

6A
Melihat Output Komputasi

User dapat melihat output file komputasi pada kolom Folder Contents

  • Atau dengan membuka Edit Files
Kolom Folder Contents.
6B User dapat menjalankan ulang ruang job yang sama dengan mengklik kembali tombol Submit.

Notifikasi Status Jalannya Komputasi via email

SLURM ALELEON Supercomputer dapat mengirim notifikasi email kepada user dengan nama "Jojo" untuk mengabarkan status berjalannya job komputasi user. Silahkan tambahan SBATCH berikut pada Submit Script apabila user ingin menerima notifikasi email dari SLURM:

#SBATCH --mail-user=<alamat-email-user> 
#SBATCH --mail-type=BEGIN,END,FAIL

SBATCH mail-type mengatur konten email notifikasi SLURM dengan pilihan opsi yang sekiranya berguna untuk user:

  • BEGIN -> notifikasi job sudah mulai
  • END -> notifikasi job sudah selesai beserta cuplikan 20 baris terakhir dari file SBATCH output dan error.
  • FAIL -> notifikasi apabila job gagal berjalan atau berhenti tidak sewajarnya.
  • TIME_LIMIT_50 -> job telah berjalan dengan durasi waktu 50% time limit.
  • TIME_LIMIT_80 -> job telah berjalan dengan durasi waktu 80% time limit.

Pelaporan Kendala dan Support

Apabila menjumpai masalah teknis dalam menjalankan komputasi, silahkan lapor dengan klik gambar berikut ini.

Wiki-pelaporankendala.jpg

---

Bila terdapat pertanyaan lainnya, silahkan hubungi admin EFISON melalui email:

support@efisonlt.com