CP2K: Perbedaan antara revisi

Dari ALELEON by EFISON
(test format)
(italic deskripsi gambar)
 
(36 revisi perantara oleh pengguna yang sama tidak ditampilkan)
Baris 8: Baris 8:
|+Modul CP2K versi CPU
|+Modul CP2K versi CPU
! rowspan="2" |Versi
! rowspan="2" |Versi
! rowspan="2" |Nama modul
! rowspan="2" |Nama modul software
! rowspan="2" |Modul
DEFAULT
! colspan="4" |Dukungan hardware
! colspan="4" |Dukungan hardware
|-
|-
Baris 22: Baris 20:
|9.1
|9.1
|cp2k/9.1-GCC10-MKL
|cp2k/9.1-GCC10-MKL
|V
|V
|V
| -
| -
Baris 29: Baris 26:
|}
|}
{| class="wikitable"
{| class="wikitable"
|+Modul CP2K dengan akselerasi GPU (''Modul ini sedang dalam tahap pengujian)''
|+Modul CP2K versi GPU (''Modul ini sedang dalam tahap pengujian)''
! rowspan="2" |Versi
! rowspan="2" |Versi
! rowspan="2" |Nama modul
! rowspan="2" |Nama modul software
! rowspan="2" |Modul
DEFAULT
! colspan="4" |Dukungan hardware
! colspan="4" |Dukungan hardware
|-
|-
Baris 45: Baris 40:
|9.1
|9.1
|cp2k/9.1-GCC10-MKL-CUDA
|cp2k/9.1-GCC10-MKL-CUDA
|V
|V
|V
| V
| V
Baris 52: Baris 46:
|}
|}


== '''Menjalankan CP2K di Compute Node''' ==
== '''Menjalankan CP2K''' ==
User dapat menjalankan komputasi dengan pilihan cara melalui tampilan terminal atau GUI web EFIRO.
User dapat menjalankan komputasi dengan pilihan cara melalui terminal atau website EFIRO ''(klik expand atau kembangkan)''.
===Menggunakan terminal - SLURM sbatch===
===Opsi Menggunakan terminal (SLURM sbatch)===
{| class="wikitable mw-collapsible mw-collapsed"
{| class="wikitable mw-collapsible mw-collapsed"
! colspan="2" |Langkah Menjalankan CP2K di Terminal melalui SLURM sbatch
! colspan="2" |Langkah Menjalankan CP2K di Terminal
[[Berkas:Sbatch Terminal.png|nirbing|500x500px]]
[[Berkas:Sbatch Terminal.png|nirbing|500x500px]]
|-
|-
| rowspan="2" |'''0'''
|'''0'''
|Sebelum login, [[Koneksi VPN ALELEON Supercomputer|'''user harus terhubung ke jaringan VPN ALELEON Supercomputer''']].
|
|-
===== Login SSH =====
|Login dengan SSH:
Tatacara login SSH lihat laman [https://wiki.efisonlt.com/wiki/Menggunakan_ALELEON_Supercomputer_via_Terminal#1_|_Login_SSH '''Login SSH ALELEON Supercomputer'''].
*User OS Windows dan MacOS -> <code>'''$ ssh <''username''>@aleleon.hpc'''</code>
*User OS Linux -> <code>'''$ ssh <''username''>@10.192.50.10'''</code>
|-
|-
|'''1'''
|'''1'''
|Siapkan file yang dibutuhkan untuk menjalankan komputasi user.
|
*[[Upload File dengan Aplikasi FTP|'''User dapat melakukan upload / download file dengan bantuan aplikasi FTP''']]  
===== Menyiapkan File Komputasi =====
|-
Siapkan file yang dibutuhkan untuk komputasi user, rekomendasi dalam satu folder per job:
|'''2'''
*File input dan data komputasi.  
|Buat '''SLURM Submit Script''' yaitu 'formulir' untuk menjalankan job komputasi:
**User dapat upload / download file ke ALELEON dengan [[Upload File dengan Aplikasi FTP|'''software FTP''']]
*Nama script dibebaskan dengan format file .sh (bash), contoh ''<code>my_job_submission.sh</code>''
*Membuat '''SLURM Submit Script''' yaitu 'formulir' untuk menjalankan job komputasi.
*Buat script pada direktori yang sama dengan file komputasi yang akan dijalankan.
**Nama script bebas dengan format file .sh (bash), contoh ''<code>my_job_submission.sh</code>''   
*Ikuti panduan template berikut dan petunjuk pada NOTES di dalamnya.
{| class="wikitable"
! colspan="5" |Panduan nilai maksimal SBATCH untuk CP2K''<sup>1</sup>''
|-
! rowspan="2" |Skenario Menjalankan CP2K
! colspan="4" |Nilai maksimal SBATCH
|-
!ntasks
(CPU)
!mem
(RAM)
!gpus
(GPU)
!time
(time limit)
|-
| ''Acuan fair policy usage<sup>2</sup>''
|''128''
|''128GB''
|''2''
| rowspan="4" |3-00:00:00
atau 72:00:00
|-
|CP2K versi CPU''<sup>3</sup>''
|384
|240GB
|0
|-
|CP2K versi CPU di high-mem node''<sup>4</sup>''
|128
|500GB
|0
|-
|CP2K versi GPU''<sup>5</sup>''
|9
|64GB
|1
|}
'''''Keterangan:'''''
#Info SBATCH lebih detail lihat laman [[Submit Script ALELEON Supercomputer|'''Submit Script ALELEON Supercomputer''']]
# Limitasi fair policy usage untuk menjaga kualitas layanan ALELEON Supercomputer.
#* User dapat mengajukan permintaan membuka limitasi apabila job membutuhkan alokasi lebih.
#* Info lebih detail lihat laman [[Limitasi Fair Usage ALELEON Supercomputer|'''Limitasi Fair Usage ALELEON Supercomputer''']]
# CP2K mendukung komputasi paralel MPI untuk berjalan ''multi-node'' : 
#* Satu node epyc mempunyai CPU 128 core.
#* Pada jumlah ntasks >128, SLURM otomatis menjalankan job secara multi-node.
#** Dalam kaitan ini, parameter mem adalah alokasi memori RAM per-node.
#* Info lebih detail lihat laman [[MPI ALELEON Supercomputer|'''MPI ALELEON Supercomputer''']].
#High-mem node epyc yaitu epyc001 memungkinkan user mengalokasikan RAM hingga 500GB.  
#*Tambahkan parameter <code>'''#SBATCH --nodelist=epyc001'''</code>
#Nilai maks versi GPU berdasarkan rekomendasi dokumentasi CP2K.
|-
|-
|'''2B'''
| rowspan="2" |'''2'''
|
|
===== Template SLURM Script CP2K =====
===== Template SLURM Submit Script CP2K =====
Ikuti panduan template berikut dan petunjuk NOTES di dalamnya.
Ikuti panduan template berikut dan petunjuk NOTES di dalamnya.
{| class="wikitable mw-collapsible mw-collapsed"
{| class="wikitable mw-collapsible mw-collapsed"
Baris 136: Baris 77:
#!/bin/bash
#!/bin/bash


# -------------------------------------------------------------
# -----------------------------------------------------
# | Template SLURM Submit Script
# Template SLURM Submit Script
# | Software        : CP2K (CPU)
# CP2K (versi CPU) | rev.080124
# | Update script  r: 06/10/2023
#  
# |
# NOTES:  
# | NOTES:  
# 1. Isi bagian yang ditandai 4 garing (////).
# | 1. Isi bagian yang ditandai 4 garing (////).
# 2. Template ini bersifat referensi.
# | 2. Template ini bersifat referensi.
#    User dapat mengubah bagian yang perlu diubah.
# |   User dapat mengubah bagian yang sekiranya perlu diubah.
# -----------------------------------------------------
# | 3. Panduan menjalankan CP2K di ALELEON lihat:
# |    https://wiki.efisonlt.com/wiki/CP2K
# -------------------------------------------------------------


# --------------------------------------------------
# -----------------------------------------------------
# Alokasi komputasi, modul software, dan file input
# Alokasi komputasi SBATCH, input, dan module
# --------------------------------------------------
# -----------------------------------------------------


# Alokasi jumlah core thread CPU
# Alokasi jumlah core thread CPU
Baris 159: Baris 97:
#SBATCH --mem=////GB
#SBATCH --mem=////GB


# Alokasi limit waktu menjalankan job.
# Alokasi limit waktu menjalankan job
# Format HH:MM:SS atau D-HH:MM:SS
# Format HH:MM:SS atau D-HH:MM:SS
#SBATCH --time=////
#SBATCH --time=////


# Definisi file untuk menampung output terminal
# Definisi file untuk menampung output terminal program
#SBATCH --output=result-%j.txt
#SBATCH --output=result-%j.txt


Baris 169: Baris 107:
#SBATCH --error=error-%j.txt  
#SBATCH --error=error-%j.txt  


# Nama input file CP2K dengan format file-nya
# Nama input file CP2K yang dijalankan
INPUT_FILE='////.inp'
INPUT_FILE="////.inp"


# Memuat modul software CP2K versi CPU
# Memuat modul software CP2K versi CPU
# Daftar modul CP2K lihat subbab "Modul CP2K" pada
# Daftar modul lihat subbab "Modul CP2K" di atas
# https://wiki.efisonlt.com/wiki/CP2K
module load cp2k////
module load cp2k////


# -------------------------------------------------
# ----------------------------------------------------
# RUN SCRIPT
# Script jalannya program
# -------------------------------------------------
# ----------------------------------------------------


# Perintah menjalankan CP2K
# Perintah menjakankan CP2K
mpirun -np $SLURM_NTASKS --mca pml ucx --mca osc ucx cp2k.zen2 $INPUT_FILE
mpirun -np ${SLURM_NTASKS} cp2k.zen2 ${INPUT_FILE}
</syntaxhighlight>
</syntaxhighlight>
|}
|}
Baris 191: Baris 128:
#!/bin/bash
#!/bin/bash


# -------------------------------------------------------------
# -----------------------------------------------------
# | Template SLURM Submit Script
# Template SLURM Submit Script
# | Software        : CP2K (GPU) - EKSPERIMENTAL
# CP2K (versi GPU) | rev.080124
# | Update script  : 06/10/2023
#  
# |
# NOTES:  
# | NOTES:  
# 1. Isi bagian yang ditandai 4 garing (////).
# | 1. Isi bagian yang ditandai 4 garing (////).
# 2. Template ini bersifat referensi.
# | 2. Template ini bersifat referensi.
#    User dapat mengubah bagian yang perlu diubah.
# |   User dapat mengubah bagian yang sekiranya perlu diubah.
# 3. Jumlah ntasks dan gpu berdasarkan doc CP2K
# | 3. Panduan menjalankan CP2K di ALELEON lihat:
#    Menggunakan rate komputasi 9 CCH/jam & 1 GH/jam
# |   https://wiki.efisonlt.com/wiki/CP2K
# -----------------------------------------------------
# -------------------------------------------------------------


# --------------------------------------------------
# -----------------------------------------------------
# Alokasi komputasi, modul software, dan file input
# Alokasi komputasi SBATCH, input, dan module
# --------------------------------------------------
# -----------------------------------------------------


# Menggunakan partisi compute node GPU
#SBATCH --partition=ampere
#SBATCH --partition=ampere


# Alokasi jumlah core thread CPU 9 menurut dokumentasi CP2K
# Alokasi jumlah core thread CPU
#SBATCH --ntasks=9  
#SBATCH --ntasks=9


# Alokasi jumlah GPU 1 menurut dokumentasi CP2K
# Alokasi jumlah GPU
#SBATCH --gpus=1
#SBATCH --gpus=1


Baris 219: Baris 156:
#SBATCH --mem=64GB
#SBATCH --mem=64GB


# Alokasi limit waktu menjalankan job.
# Alokasi limit waktu menjalankan job
# Format HH:MM:SS atau D-HH:MM:SS
# Format HH:MM:SS atau D-HH:MM:SS
#SBATCH --time=////
#SBATCH --time=////


# Definisi file untuk menampung output terminal
# Definisi file untuk menampung output terminal program
#SBATCH --output=result-%j.txt
#SBATCH --output=result-%j.txt


Baris 229: Baris 166:
#SBATCH --error=error-%j.txt  
#SBATCH --error=error-%j.txt  


# Nama input file CP2K dengan format file-nya
# Nama input file CP2K yang dijalankan
INPUT_FILE='////.inp'
INPUT_FILE="////.inp"


# Memuat modul software CP2K versi GPU
# Memuat modul software CP2K versi GPU
module load cp2k/9.1-GCC10-MKL-CUDA
# Daftar modul lihat subbab "Modul CP2K" di atas
module load cp2k////


# -------------------------------------------------
# ----------------------------------------------------
# RUN SCRIPT
# Script jalannya program
# -------------------------------------------------
# ----------------------------------------------------


# Unset UCX supaya MPI berjalan di NVIDIA
# Unset UCX supaya MPI berjalan di NVIDIA
Baris 243: Baris 181:
unset UCX_NET_DEVICES
unset UCX_NET_DEVICES


# Perintah menjalankan CP2K
# Perintah menjakankan CP2K
mpirun -np $SLURM_NTASKS --mca pml ucx --mca osc ucx cp2k.zen2 $INPUT_FILE
mpirun -np ${SLURM_NTASKS} cp2k.zen2 ${INPUT_FILE}
</syntaxhighlight>
</syntaxhighlight>
|}
|}
|-
|-
|'''2C'''
|
|
===== Panduan Nilai Maksimal SBATCH untuk CP2K =====
===== Panduan Nilai Maksimal SBATCH untuk CP2K =====
{| class="wikitable"
{| class="wikitable mw-collapsible mw-collapsed"
! colspan="5" |Panduan nilai maksimal SBATCH untuk CP2K''<sup>1</sup>''
! colspan="5" |Panduan Nilai Maksimal SBATCH ntasks, mem, gpus, time
|-
! rowspan="2" |Skenario Menjalankan CP2K
! colspan="4" |Nilai maksimal SBATCH
|-
|-
!Skenario Komputasi
!ntasks
!ntasks
(CPU)
(CPU)
Baris 266: Baris 201:
(time limit)
(time limit)
|-
|-
| ''Acuan fair policy usage<sup>2</sup>''
| Fair policy usage untuk akumulasi semua job<sup>''1''</sup>
|''128''
|128
|''128GB''
|128GB
|''2''
|2
| rowspan="4" |3-00:00:00  
| rowspan="4" |3-00:00:00  
atau 72:00:00
atau  
 
72:00:00
|-
|-
|CP2K versi CPU''<sup>3</sup>''
|CP2K versi CPU''<sup>2</sup>''
|384
|384
|240GB
|240GB''<sup>2</sup>''
|0
|0
|-
|-
|CP2K versi CPU di high-mem node''<sup>4</sup>''
|CP2K versi CPU di high-mem node
 
* Tambahkan <code>#SBATCH --nodelist=epyc001</code>
|128
|128
|500GB
|500GB
|0
|0
|-
|-
|CP2K versi GPU''<sup>5</sup>''
|CP2K versi GPU''<sup>3</sup>''
|9
|9
|64GB  
|64GB  
|1
|1
|-
| colspan="5" |'''''Keterangan:'''''
# Limitasi untuk menjaga kualitas layanan ALELEON Supercomputer.
#* User dapat mengajukan permintaan buka limitasi apabila butuh alokasi lebih.
#* Info detail buka laman [[Limitasi Fair Usage ALELEON Supercomputer|'''Limitasi Fair Usage ALELEON Supercomputer''']]
# CP2K mendukung komputasi paralel MPI. Ketika jumlah ntasks lebih dari 128: 
#* SLURM otomatis menjalankan job pada multi-node.
#* Parameter mem adalah alokasi memori RAM per-node.
#* Info detail buka laman [[MPI ALELEON Supercomputer|'''MPI ALELEON Supercomputer''']].
#Berdasarkan rekomendasi dokumentasi CP2K.
|-
! colspan="5" |Keterangan tambahan
|-
| colspan="5" |
* '''Untuk akun perseorangan dengan Kredit Core Hour:'''
** SLURM akan menahan job apabila:
*** ntasks * time (jam) lebih besar dari sisa CPU Core Hour user.
*** gpus * time (jam) lebih besar dari sisa GPU Hour user.
** Cek sisa Kredit Core Hour melalui perintah:
$ '''sausage'''
* Info SBATCH lebih detail lihat laman [[Submit Script ALELEON Supercomputer|'''Submit Script ALELEON Supercomputer''']]
|}
|}
|-
|'''2D'''
|
===== Daftar Modul Software CP2K =====
|-
|-
| '''3'''
| '''3'''
Baris 339: Baris 297:
|'''4B'''
|'''4B'''
|
|
===== Membatalkan Job Komputasi =====
===== Menghentikan Job Komputasi =====
Apabila user ingin membatalkan job, gunakan perintah scancel berdasarkan job ID.
Apabila user ingin membatalkan job, gunakan perintah scancel berdasarkan job ID.
*Job ID dapat dilihat melalui perintah squeue pada kolom JOBID.
*Job ID dapat dilihat melalui perintah squeue pada kolom JOBID.
Baris 347: Baris 305:
  $ scancel 231
  $ scancel 231
|}
|}
===Menggunakan GUI Web - EFIRO Job Composer===
===Opsi Menggunakan Web EFIRO (EFIRO Job Composer)===
{| class="wikitable mw-collapsible mw-collapsed"
! colspan="2" | Langkah Menjalankan CP2K di Web EFIRO
[[Berkas:Efirojobcomposer3.png|nirbing|500x500px]]
[[Berkas:Efirojobcomposer3.png|nirbing|500x500px]]
|-
|'''0'''
|
===== Login Web EFIRO =====


Menjalankan komputasi dengan tampilan grafis pada formulir job submission EFIRO Job Composer.
* [[Koneksi VPN ALELEON Supercomputer|'''User harus terhubung ke jaringan VPN ALELEON Supercomputer''']].
{| class="wikitable mw-collapsible mw-collapsed"
* Buka alamat web '''<code><nowiki>http://aleleon.ood</nowiki></code>''' lalu masukkan username dan password user.
! colspan="2" | Langkah Menjalankan CP2K via EFIRO Job Composer
**Bagi user Linux, buka alamat <code>'''<nowiki>http://10.192.50.11</nowiki>'''</code>
|-
| rowspan="2" |'''0'''
|Sebelum login, [[Koneksi VPN ALELEON Supercomputer|'''user harus terhubung ke jaringan VPN ALELEON Supercomputer''']].
|-
|Buka alamat web '''<code><nowiki>http://aleleon.ood</nowiki></code>''' kemudian masukkan username dan password user.
*Bagi user Linux, buka alamat <code>'''<nowiki>http://10.192.50.11</nowiki>'''</code>
|-
|-
|'''1'''
|'''1'''
|Buka menu dashboard EFIRO '''<code>Jobs</code> > <code>Jobs Composer</code>'''
|
[[Berkas:Efirojobcomposermenu.png|nirbing|300x300px|al=]]
===== Membuka Job Composer dan Memilih Template Job =====
 
* Buka menu '''<code>Jobs</code>''' > '''<code>Jobs Composer</code>''' pada dashboard EFIRO.
* Pilih '''<code>New Job</code>''' > '''<code>From Template</code>'''
 
[[Berkas:Efirojobcomposermenu.png|nir|jmpl|''Menu '''<code>Jobs</code> > <code>Jobs Composer</code>''''' ]][[Berkas:Jcnewjobmarked.png|al=|nir|jmpl|220x220px|''Menu '''<code>New Jobs</code>''' > '''<code>From Template</code>''''']]
|-
|-
|'''2'''
|'''2'''
|Pilih '''<code>New Jobs</code> > <code>From Template</code>'''
|[[Berkas:Jcselecttemplate3.png|nirbing|600x600px]]
[[Berkas:Jcnewjobmarked.png|al=|nirbing|180x180px]]
 
|-
* PIlih template CP2K yang diinginkan.
|'''3'''
* Isi atau ganti kolom '''<code>Job Name</code>''' sesuai keinginan user.
|[[Berkas:Jcselecttemplate3.png|al=|nir|jmpl|Pilih template CP2K yang diinginkan. Isi atau ganti <code>'''Job Name'''</code> sesuai keinginan user, kemudian klik <code>'''Create New Job'''</code>.|400x400px]]
* Apabila sudah selesai, klik '''<code>Create New Job</code>'''.
 
{| class="wikitable"
{| class="wikitable"
! colspan="2" |Template CP2K yang tersedia
! colspan="2" |Template CP2K yang tersedia
Baris 377: Baris 341:
|-
|-
|CP2K 9.1 (CPU)
|CP2K 9.1 (CPU)
|Menjalankan CP2K versi 9.1 di CPU
|Menjalankan CP2K 9.1 pada CPU
|-
|-
|CP2K 9.1 (GPU) Eksperimental
|CP2K 9.1 (GPU)  
|Menjalankan CP2K versi 9.1 di GPU. Dalam fase pengujian
|Menjalankan CP2K 9.1 dengan akselerasi GPU.  
|}
|}
|-
|-
|'''4'''
|'''3'''
|[[Berkas:Jcjoboption3.png|nirbing|600x600px]]
|
Gunakan menu '''<code>Edit Files</code>''' untuk upload file yang dibutuhkan'''.'''
===== Menyiapkan File Komputasi =====
*Laman Edit Files juga dapat melakukan view / download / edit / rename / delete file.
[[Berkas:Jcjoboption3.png|nirbing|600x600px]]
*''Fitur upload pada laman Edit Files '''mempunyai batasan ukuran upload 2GB per file'''.''
 
**''Gunakan [[Upload File dengan Aplikasi FTP|'''aplikasi FTP''']] apabila user hendak mengupload file tunggal diatas 2GB.''
Gunakan menu <code>'''Edit Files'''</code> untuk upload file komputasi yang dibutuhkan.
 
* Laman Edit Files juga dapat melakukan download / edit / rename / delete file.
* Fitur upload pada Edit Files mempunyai limit kapasitas '''2GB per file'''.
** Gunakan [[Upload File dengan Aplikasi FTP|'''aplikasi FTP''']] untuk upload file tunggal diatas 2GB.
|-
|-
|'''5'''
| rowspan="2" |'''4'''
|[[Berkas:Jceditor3.png|al=|nirbing|300x300px]]
|
===== Melengkapi Submit Script =====
Submit Script adalah "formulir" untuk menjalankan job komputasi user.
 
* Lengkapi Submit Script melalui menu '''<code>Open Editor</code>'''.
* Ikuti petunjuk NOTES di dalamnya.
* Jangan lupa klik <code>'''Save'''</code> setiap sekali mengubah script.


Melalui '''<code>Open Editor</code>''', lengkapi Submit Script dengan mengganti bagian yang di tandai 4 garis miring (////).
[[Berkas:Jceditor3.png|al=|nirbing|500x500px]]
*''Jangan lupa klik <code>'''Save'''</code> setiap sekali mengubah script.''
*Template ini bersifat referensi, user dapat mengubah bagian yang sekiranya perlu diubah.
{| class="wikitable"
! colspan="6" |Panduan nilai maksimal SBATCH untuk CP2K''<sup>1</sup>''
|-
|-
! rowspan="2" |Skenario Menjalankan CP2K
|
! rowspan="2" |Berjalan di
===== Panduan Nilai Maksimal SBATCH =====
Compute Node
{| class="wikitable mw-collapsible mw-collapsed"
! colspan="4" |Nilai maksimal SBATCH
! colspan="5" |Panduan Nilai Maksimal SBATCH ntasks, mem, gpus, time
|-
|-
!Skenario Komputasi
!ntasks
!ntasks
(CPU)
(CPU)
Baris 413: Baris 384:
(time limit)
(time limit)
|-
|-
| colspan="2" | ''Acuan fair policy usage<sup>2</sup>''
| Fair policy usage untuk akumulasi semua job<sup>''1''</sup>
|''128''
|128
|''128GB''
|128GB
|''2''
|2
| rowspan="4" |3-00:00:00  
| rowspan="4" |3-00:00:00  
atau 72:00:00
atau  
 
72:00:00
|-
|-
|CP2K versi CPU''<sup>3</sup>''
|CP2K versi CPU''<sup>2</sup>''
|epyc (CPU)
|384
|384
|240GB
|240GB''<sup>2</sup>''
|0
|0
|-
|-
|CP2K versi CPU di high-mem node''<sup>4</sup>''
|CP2K versi CPU di high-mem node
|epyc (CPU)
 
* Tambahkan <code>#SBATCH --nodelist=epyc001</code>
|128
|128
|500GB
|500GB
|0
|0
|-
|-
|CP2K versi GPU''<sup>5</sup>''
|CP2K versi GPU''<sup>3</sup>''
|ampere (GPU)
|9
|9
|64GB  
|64GB  
|1
|1
|}'''''Keterangan:'''''
#Info SBATCH lebih detail lihat laman [[Submit Script ALELEON Supercomputer|'''Submit Script ALELEON Supercomputer''']]
# Limitasi fair policy usage untuk menjaga kualitas layanan ALELEON Supercomputer.
#* User dapat mengajukan permintaan membuka limitasi apabila job membutuhkan alokasi lebih.
#* Info lebih detail lihat laman [[Limitasi Fair Usage ALELEON Supercomputer|'''Limitasi Fair Usage ALELEON Supercomputer''']]
# CP2K mendukung komputasi paralel MPI untuk berjalan ''multi-node'' : 
#* Satu node epyc mempunyai CPU 128 core.
#* Pada jumlah ntasks >128, SLURM otomatis menjalankan job secara multi-node.
#** Dalam kaitan ini, parameter mem adalah alokasi memori RAM per-node.
#* Info lebih detail lihat laman [[MPI ALELEON Supercomputer|'''MPI ALELEON Supercomputer''']].
#High-mem node epyc yaitu epyc001 memungkinkan user mengalokasikan RAM hingga 500GB. 
#*Tambahkan parameter <code>'''#SBATCH --nodelist=epyc001'''</code>
#Nilai maks versi GPU berdasarkan rekomendasi dokumentasi CP2K.
|-
|-
|'''6A'''
| colspan="5" |'''''Keterangan:'''''
|Jalankan job dengan klik tombol '''<code>Submit</code>'''.
# Limitasi untuk menjaga kualitas layanan ALELEON Supercomputer.
#* User dapat mengajukan permintaan buka limitasi apabila butuh alokasi lebih.
#* Info detail buka laman [[Limitasi Fair Usage ALELEON Supercomputer|'''Limitasi Fair Usage ALELEON Supercomputer''']]
# CP2K mendukung komputasi paralel MPI. Ketika jumlah ntasks lebih dari 128: 
#* SLURM otomatis menjalankan job pada multi-node.
#* Parameter mem adalah alokasi memori RAM per-node.
#* Info detail buka laman [[MPI ALELEON Supercomputer|'''MPI ALELEON Supercomputer''']].
#Berdasarkan rekomendasi dokumentasi CP2K.
|-
! colspan="5" |Keterangan tambahan
|-
| colspan="5" |
*'''Untuk akun perseorangan dengan Kredit Core Hour:'''
** SLURM akan menahan job apabila:
*** ntasks * time (jam) lebih besar dari sisa CPU Core Hour user.
*** gpus * time (jam) lebih besar dari sisa GPU Hour user.
** Cek sisa Kredit Core Hour melalui menu '''<code>Open Terminal</code>''' dan jalankan perintah:
$ '''sausage'''
[[Berkas:Jcjoboption4.png|nirbing|600x600px]]
* Info SBATCH lebih detail lihat laman [[Submit Script ALELEON Supercomputer|'''Submit Script ALELEON Supercomputer''']]   
|}
|-
|'''5'''
|
===== Menjalankan Job Komputasi =====
Jalankan job dengan klik tombol '''<code>Submit</code>'''.


[[Berkas:Jcsubmit2.png|al=|nirbing|600x600px]]
[[Berkas:Jcsubmit2.png|al=|nirbing|600x600px]]
Berikut penjelasan kolom '''<code>Status</code>,''' pantau dengan refresh halaman job''':'''
{| class="wikitable"
{| class="wikitable"
|+''Penjelasan kolom '''<code>Status</code>,''' pantau dengan refresh halaman job''
!Status
!Status
!Arti
!Arti
Baris 469: Baris 452:
|Queue
|Queue
|Job mengantri dan belum berjalan.
|Job mengantri dan belum berjalan.
{| class="wikitable mw-collapsible mw-collapsed"
!Langkah melihat status job ketika queue
|-
|Buka <code>'''Jobs > Active Jobs'''</code> pada dashboard EFIRO.
*Lakukan langkah sesuai gambar dibawah ini
[[Berkas:Efiroqueueedit.png|al=|jmpl|''Halaman Active Jobs. Ubah opsi '''<code>Your jobs</code>''' untuk melihat status job user saja. Klik simbol '''>''' untuk melihat status  job pending pada kolom '''Reason'''. Arti reason lihat laman '''[[Daftar Reason NODELIST ALELEON Supercomputer]].'''''|kiri]]
|}
|-
|-
|Completed
|Completed
Baris 476: Baris 466:
|Job berhenti di tengah jalan, bisa karena di Stop atau Delete oleh user.
|Job berhenti di tengah jalan, bisa karena di Stop atau Delete oleh user.
|}
|}
|-
===== Menghentikan Job Komputasi =====
|'''6B'''
Untuk menghentikan job yang tengah berjalan, klik tombol '''<code>Stop</code>'''.
|Untuk menghentikan job yang tengah berjalan, klik tombol '''Stop'''.


[[Berkas:Stop.png|nirbing|600x600px]]
[[Berkas:Stop.png|nirbing|600x600px]]
|-
|-
|'''7A'''
|'''6A'''
|Hasil output job dapat dilihat pada kolom '''<code>Folder Contents</code>''' atau membuka halaman '''<code>Edit Files</code>.'''[[Berkas:Jcfoldercontentsedit.png|al=|nir|jmpl|User dapat melihat semua file output yang keluar di kolom '''<code>Folder Contents</code>'''.]][[Berkas:Jcjoboption3.png|nir|jmpl|atau dengan membuka menu '''<code>Edit Files</code>'''.]]
|
===== Melihat Output Komputasi =====
User dapat melihat output file komputasi pada kolom '''<code>Folder Contents</code>'''  
 
* Atau dengan membuka '''<code>Edit Files</code>'''
 
[[Berkas:Jcfoldercontentsedit.png|al=|nir|jmpl|''Kolom '''<code>Folder Contents</code>'''.'']]
|-
|-
|'''7B'''
|'''6B'''
|User dapat '''menjalankan ulang ruang job yang sama''' dengan mengklik kembali tombol '''<code>Submit</code>'''.
|User dapat '''menjalankan ulang ruang job yang sama''' dengan mengklik kembali tombol '''<code>Submit</code>'''.
|}
|}
Baris 499: Baris 494:
*TIME_LIMIT_80 -> job telah berjalan dengan durasi waktu 80% time limit.
*TIME_LIMIT_80 -> job telah berjalan dengan durasi waktu 80% time limit.
=='''Pelaporan Kendala dan Support'''==
=='''Pelaporan Kendala dan Support'''==
Apabila menjumpai masalah teknis dalam menjalankan komputasi CP2K, silahkan lapor dengan klik gambar berikut ini.
Apabila menjumpai masalah teknis dalam menjalankan komputasi, silahkan lapor dengan klik gambar berikut ini.


[[Berkas:Wiki-pelaporankendala.jpg|1000x1000px|link=https://efisonlt.com/aleleonbugreport]]
[[Berkas:Wiki-pelaporankendala.jpg|1000x1000px|link=https://efisonlt.com/aleleonbugreport]]

Revisi terkini sejak 15 Januari 2024 10.25

CP2K.png

CP2K adalah package untuk quantum chemistry dan solid state physics yang dapat melakukan simulasi liquid, molekolar, periodik, material, kristal, dan sistem biologis. CP2K menggunakan pemodelan DFT dengan pendekatan Gaussian and plane waves GPW dan GAPW.

Modul CP2K

Berikut adalah detail versi CP2K yang tersedia secara global di ALELEON Supercomputer:

Modul CP2K versi CPU
Versi Nama modul software Dukungan hardware
CPU GPU OMP

Threading

MPI

multi-node

9.1 cp2k/9.1-GCC10-MKL V - - V
Modul CP2K versi GPU (Modul ini sedang dalam tahap pengujian)
Versi Nama modul software Dukungan hardware
CPU GPU OMP

Threading

MPI

multi-node

9.1 cp2k/9.1-GCC10-MKL-CUDA V V - V

Menjalankan CP2K

User dapat menjalankan komputasi dengan pilihan cara melalui terminal atau website EFIRO (klik expand atau kembangkan).

Opsi Menggunakan terminal (SLURM sbatch)

Langkah Menjalankan CP2K di Terminal

Sbatch Terminal.png

0
Login SSH

Tatacara login SSH lihat laman Login SSH ALELEON Supercomputer.

1
Menyiapkan File Komputasi

Siapkan file yang dibutuhkan untuk komputasi user, rekomendasi dalam satu folder per job:

  • File input dan data komputasi.
    • User dapat upload / download file ke ALELEON dengan software FTP.
  • Membuat SLURM Submit Script yaitu 'formulir' untuk menjalankan job komputasi.
    • Nama script bebas dengan format file .sh (bash), contoh my_job_submission.sh
2
Template SLURM Submit Script CP2K

Ikuti panduan template berikut dan petunjuk NOTES di dalamnya.

Template SLURM Submit Script untuk CP2K versi CPU
#!/bin/bash

# -----------------------------------------------------
# Template SLURM Submit Script
# CP2K (versi CPU) | rev.080124
# 
# NOTES: 
# 1. Isi bagian yang ditandai 4 garing (////).
# 2. Template ini bersifat referensi.
#    User dapat mengubah bagian yang perlu diubah.
# -----------------------------------------------------

# -----------------------------------------------------
# Alokasi komputasi SBATCH, input, dan module
# -----------------------------------------------------

# Alokasi jumlah core thread CPU
#SBATCH --ntasks=////

# Alokasi jumlah memori RAM (satuan GB)
#SBATCH --mem=////GB

# Alokasi limit waktu menjalankan job
# Format HH:MM:SS atau D-HH:MM:SS
#SBATCH --time=////

# Definisi file untuk menampung output terminal program
#SBATCH --output=result-%j.txt

# Definisi file untuk menampung output error log    
#SBATCH --error=error-%j.txt 

# Nama input file CP2K yang dijalankan
INPUT_FILE="////.inp"

# Memuat modul software CP2K versi CPU
# Daftar modul lihat subbab "Modul CP2K" di atas 
module load cp2k////

# ----------------------------------------------------
# Script jalannya program
# ----------------------------------------------------

# Perintah menjakankan CP2K
mpirun -np ${SLURM_NTASKS} cp2k.zen2 ${INPUT_FILE}
Template SLURM Submit Script untuk CP2K versi GPU
#!/bin/bash

# -----------------------------------------------------
# Template SLURM Submit Script
# CP2K (versi GPU) | rev.080124
# 
# NOTES: 
# 1. Isi bagian yang ditandai 4 garing (////).
# 2. Template ini bersifat referensi.
#    User dapat mengubah bagian yang perlu diubah.
# 3. Jumlah ntasks dan gpu berdasarkan doc CP2K
#    Menggunakan rate komputasi 9 CCH/jam & 1 GH/jam
# -----------------------------------------------------

# -----------------------------------------------------
# Alokasi komputasi SBATCH, input, dan module
# -----------------------------------------------------

# Menggunakan partisi compute node GPU
#SBATCH --partition=ampere

# Alokasi jumlah core thread CPU
#SBATCH --ntasks=9

# Alokasi jumlah GPU
#SBATCH --gpus=1

# Alokasi jumlah memori RAM (satuan GB)
#SBATCH --mem=64GB

# Alokasi limit waktu menjalankan job
# Format HH:MM:SS atau D-HH:MM:SS
#SBATCH --time=////

# Definisi file untuk menampung output terminal program
#SBATCH --output=result-%j.txt

# Definisi file untuk menampung output error log    
#SBATCH --error=error-%j.txt 

# Nama input file CP2K yang dijalankan
INPUT_FILE="////.inp"

# Memuat modul software CP2K versi GPU
# Daftar modul lihat subbab "Modul CP2K" di atas 
module load cp2k////

# ----------------------------------------------------
# Script jalannya program
# ----------------------------------------------------

# Unset UCX supaya MPI berjalan di NVIDIA
unset UCX_TLS
unset UCX_NET_DEVICES

# Perintah menjakankan CP2K
mpirun -np ${SLURM_NTASKS} cp2k.zen2 ${INPUT_FILE}
Panduan Nilai Maksimal SBATCH untuk CP2K
Panduan Nilai Maksimal SBATCH ntasks, mem, gpus, time
Skenario Komputasi ntasks

(CPU)

mem

(RAM)

gpus

(GPU)

time

(time limit)

Fair policy usage untuk akumulasi semua job1 128 128GB 2 3-00:00:00

atau

72:00:00

CP2K versi CPU2 384 240GB2 0
CP2K versi CPU di high-mem node
  • Tambahkan #SBATCH --nodelist=epyc001
128 500GB 0
CP2K versi GPU3 9 64GB 1
Keterangan:
  1. Limitasi untuk menjaga kualitas layanan ALELEON Supercomputer.
  2. CP2K mendukung komputasi paralel MPI. Ketika jumlah ntasks lebih dari 128:
    • SLURM otomatis menjalankan job pada multi-node.
    • Parameter mem adalah alokasi memori RAM per-node.
    • Info detail buka laman MPI ALELEON Supercomputer.
  3. Berdasarkan rekomendasi dokumentasi CP2K.
Keterangan tambahan
  • Untuk akun perseorangan dengan Kredit Core Hour:
    • SLURM akan menahan job apabila:
      • ntasks * time (jam) lebih besar dari sisa CPU Core Hour user.
      • gpus * time (jam) lebih besar dari sisa GPU Hour user.
    • Cek sisa Kredit Core Hour melalui perintah:
$ sausage
3
Menjalankan Job Komputasi

Jalankan job dengan perintah sbatch.

$ sbatch <nama-SLURM-Submit-script>

Contoh menjalankan nama script my_job_submission.sh.

$ sbatch my_job_submission.sh
4A User dapat melihat status jalannya job dengan perintah squeue berikut.
  • Apabila tidak ada output artinya tidak ada job user yang berjalan / antri pada waktu itu.
$ squeue -ul $USER

Berikut adalah daftar STATE (ST) dari squeue yang menunjukkan status berjalannya job:

Daftar STATE squeue SLURM
STATE Kepanjangan Penjelasan
R RUN Job berjalan
PD PENDING Job tertahan, lihat keterangan NODELIST(REASON)
CG COMPLETING Job selesai dan dalam proses clean-up SLURM
CA CANCELED Job dibatalkan oleh user
PR PREEMPETED Job dibatalkan oleh admin EFISON, alasan dikabarkan melalui email
S SUSPENDED Job ditahan oleh admin EFISON
4B
Menghentikan Job Komputasi

Apabila user ingin membatalkan job, gunakan perintah scancel berdasarkan job ID.

  • Job ID dapat dilihat melalui perintah squeue pada kolom JOBID.
  • User hanya bisa membatalkan job submission milik user sendiri.
$ scancel <job-ID-submission-user>

Contoh user membatalkan job submission milik user dengan ID 231.

$ scancel 231

Opsi Menggunakan Web EFIRO (EFIRO Job Composer)

Langkah Menjalankan CP2K di Web EFIRO

Efirojobcomposer3.png

0
Login Web EFIRO
1
Membuka Job Composer dan Memilih Template Job
  • Buka menu Jobs > Jobs Composer pada dashboard EFIRO.
  • Pilih New Job > From Template
Menu Jobs > Jobs Composer
Menu New Jobs > From Template
2 Jcselecttemplate3.png
  • PIlih template CP2K yang diinginkan.
  • Isi atau ganti kolom Job Name sesuai keinginan user.
  • Apabila sudah selesai, klik Create New Job.
Template CP2K yang tersedia
Nama Template Penjelasan
CP2K 9.1 (CPU) Menjalankan CP2K 9.1 pada CPU
CP2K 9.1 (GPU) Menjalankan CP2K 9.1 dengan akselerasi GPU.
3
Menyiapkan File Komputasi

Jcjoboption3.png

Gunakan menu Edit Files untuk upload file komputasi yang dibutuhkan.

  • Laman Edit Files juga dapat melakukan download / edit / rename / delete file.
  • Fitur upload pada Edit Files mempunyai limit kapasitas 2GB per file.
4
Melengkapi Submit Script

Submit Script adalah "formulir" untuk menjalankan job komputasi user.

  • Lengkapi Submit Script melalui menu Open Editor.
  • Ikuti petunjuk NOTES di dalamnya.
  • Jangan lupa klik Save setiap sekali mengubah script.

Panduan Nilai Maksimal SBATCH
Panduan Nilai Maksimal SBATCH ntasks, mem, gpus, time
Skenario Komputasi ntasks

(CPU)

mem

(RAM)

gpus

(GPU)

time

(time limit)

Fair policy usage untuk akumulasi semua job1 128 128GB 2 3-00:00:00

atau

72:00:00

CP2K versi CPU2 384 240GB2 0
CP2K versi CPU di high-mem node
  • Tambahkan #SBATCH --nodelist=epyc001
128 500GB 0
CP2K versi GPU3 9 64GB 1
Keterangan:
  1. Limitasi untuk menjaga kualitas layanan ALELEON Supercomputer.
  2. CP2K mendukung komputasi paralel MPI. Ketika jumlah ntasks lebih dari 128:
    • SLURM otomatis menjalankan job pada multi-node.
    • Parameter mem adalah alokasi memori RAM per-node.
    • Info detail buka laman MPI ALELEON Supercomputer.
  3. Berdasarkan rekomendasi dokumentasi CP2K.
Keterangan tambahan
  • Untuk akun perseorangan dengan Kredit Core Hour:
    • SLURM akan menahan job apabila:
      • ntasks * time (jam) lebih besar dari sisa CPU Core Hour user.
      • gpus * time (jam) lebih besar dari sisa GPU Hour user.
    • Cek sisa Kredit Core Hour melalui menu Open Terminal dan jalankan perintah:
$ sausage

Jcjoboption4.png

5
Menjalankan Job Komputasi

Jalankan job dengan klik tombol Submit.

Penjelasan kolom Status, pantau dengan refresh halaman job
Status Arti
Not Submitted Job belum pernah dijalankan.
Running Job berjalan.
Queue Job mengantri dan belum berjalan.
Langkah melihat status job ketika queue
Buka Jobs > Active Jobs pada dashboard EFIRO.
  • Lakukan langkah sesuai gambar dibawah ini
Halaman Active Jobs. Ubah opsi Your jobs untuk melihat status job user saja. Klik simbol > untuk melihat status job pending pada kolom Reason. Arti reason lihat laman Daftar Reason NODELIST ALELEON Supercomputer.
Completed Job selesai berjalan.
Failed Job berhenti di tengah jalan, bisa karena di Stop atau Delete oleh user.
Menghentikan Job Komputasi

Untuk menghentikan job yang tengah berjalan, klik tombol Stop.

Stop.png

6A
Melihat Output Komputasi

User dapat melihat output file komputasi pada kolom Folder Contents

  • Atau dengan membuka Edit Files
Kolom Folder Contents.
6B User dapat menjalankan ulang ruang job yang sama dengan mengklik kembali tombol Submit.

Notifikasi Status Jalannya Komputasi via email

SLURM ALELEON Supercomputer dapat mengirim notifikasi email kepada user dengan nama "Jojo" untuk mengabarkan status berjalannya job komputasi user. Silahkan tambahan SBATCH berikut pada Submit Script apabila user ingin menerima notifikasi email dari SLURM:

#SBATCH --mail-user=<alamat-email-user> 
#SBATCH --mail-type=BEGIN,END,FAIL

SBATCH mail-type mengatur konten email notifikasi SLURM dengan pilihan opsi yang sekiranya berguna untuk user:

  • BEGIN -> notifikasi job sudah mulai
  • END -> notifikasi job sudah selesai beserta cuplikan 20 baris terakhir dari file SBATCH output dan error.
  • FAIL -> notifikasi apabila job gagal berjalan atau berhenti tidak sewajarnya.
  • TIME_LIMIT_50 -> job telah berjalan dengan durasi waktu 50% time limit.
  • TIME_LIMIT_80 -> job telah berjalan dengan durasi waktu 80% time limit.

Pelaporan Kendala dan Support

Apabila menjumpai masalah teknis dalam menjalankan komputasi, silahkan lapor dengan klik gambar berikut ini.

Wiki-pelaporankendala.jpg

---

Bila terdapat pertanyaan lainnya, silahkan hubungi admin EFISON melalui email:

support@efisonlt.com