DFTB+: Perbedaan antara revisi

Dari ALELEON by EFISON
(swap urutan file input dan SK)
 
(17 revisi perantara oleh pengguna yang sama tidak ditampilkan)
Baris 8: Baris 8:
! rowspan="2" |Versi
! rowspan="2" |Versi
! rowspan="2" |Nama modul
! rowspan="2" |Nama modul
! rowspan="2" |Modul
DEFAULT
! colspan="4" |Dukungan hardware
! colspan="4" |Dukungan hardware
|-
|-
Baris 21: Baris 19:
|22.2
|22.2
|dftbplus/22.2-GCC11.3-AOCL4.0
|dftbplus/22.2-GCC11.3-AOCL4.0
|V
|V
|V
| -
| -
Baris 27: Baris 24:
|V
|V
|}
|}
 
== '''Menyiapkan File Slaster-Koster (SK)''' ==
== '''File Input DFTB+''' ==
File input DFTB+ membutuhkan file '''Slater-Koster (SK)''' pada bagian Hamiltonian yang bisa didapatkan pada tautan berikut. File dalam format .tar sehingga perlu di ekstrak.
Perlu diperhatikan bahwa user harus membuat file input DFTB+ dengan nama dan format '''dftb_in.hsd''' dan file input ini harus ditaruh pada satu direktori dengan SLURM Submit Script.
 
== '''Slater-Koster Files''' ==
File input dftb_in.hsd membutuhkan file Slater-Koster (SK) pada bagian Hamiltonian. User dapat mengunduh file SK dari web resmi DFTB+ pada tautan berikut:
 
* [https://dftb.org/parameters/download '''Halaman utama Download File SK''']
* [https://dftb.org/parameters/download '''Halaman utama Download File SK''']
* [https://dftb.org/parameters/download/all-sk-files '''File SK dalam satu archive''']
* [https://dftb.org/parameters/download/all-sk-files '''File SK dalam satu archive''']


Pastikan file input user pada bagian Hamiltonian menunjuk direktori file SK yang tepat sesuai direktori tempat user menyimpan file SK tersebut.
Admin menyarankan menaruh / upload folder SK pada direktori HOME supaya dapat diakses oleh banyak job.
'''$HOME'''''/<folder-file-SK-yang-dibutuhkan>''
Pastikan file input dftb_in.hsd pada bagian Hamiltonian menunjuk direktori file SK spesifik pada HOME tersebut.


== '''Pure MPI atau Hybrid MPI/OMP pada DFTB+ versi CPU''' ==
== '''File Input dftb_in.hsd''' ==
DFTB+ secara default berjalan dengan paralelisasi OpenMP (OMP). Sementara itu DFTB+ pada ALELEON Supercomputer dicompile dengan MPI sehingga dapat berjalan dengan paralelisasi hybrid MPI/OMP. Tim admin menyerahkan keputusan kepada user untuk memilih antara menjalankan DFTB+ dengan metode pure MPI atau hybrid MPI/OMP.
User membuat file input DFTB+ dengan nama file '''<code>dftb_in.hsd</code>'''.


'''User dapat memilih metode Pure MPI atau Hybrid MPI/OMP pada [[Submit Script ALELEON Supercomputer|SLURM Submit Script]] untuk menjalankan DFTB+ versi CPU:'''
* Pastikan bagian Hamiltonian di file input menunjuk direktori file SK yang tepat.
 
* SBATCH ntasks mewakili jumlah task MPI sedangkan SBATCH cpus-per-task mewakili jumlah thread OMP.


== '''Pilihan MPI atau Threading OpenMP untuk Menjalankan DFTB+''' ==
DFTB+ di ALELEON Supercomputer dapat berjalan melalui paralelisasi '''MPI''', '''OpenMP''' (OMP), atau keduanya ('''hybrid MPI/OMP''') untuk menggunakan multi-core CPU dan multi-node. Admin menyerahkan keputusan kepada user untuk memilih metode paralelisasi melalui parameter Submit Script berikut:
*''Penjelasan submit script lihat subbab berikutnya (Pilihan Menjalankan Komputasi).''
*'''SBATCH ntasks mewakili jumlah task MPI sedangkan SBATCH cpus-per-task mewakili jumlah thread OMP.'''
  '''#SBATCH --ntasks''' ''-> mewakili jumlah task MPI''
  '''#SBATCH --ntasks''' ''-> mewakili jumlah task MPI''
  '''#SBATCH --cpus-per-task''' ''-> mewakili jumlah thread OpenMP''
  '''#SBATCH --cpus-per-task''' ''-> mewakili jumlah thread OpenMP''
 
* '''Apabila ingin MPI saja,''' isi jumlah SBATCH cpus-per-task dengan 1:
* Apabila ingin Pure MPI maka isi jumlah SBATCH cpus-per-task dengan 1.
 
  ''# Pure MPI''  
  ''# Pure MPI''  
  '''#SBATCH --ntasks='''''<isi-sesuai-keinginan>''
  '''#SBATCH --ntasks='''''[isi-sesuai-keinginan]''
  '''#SBATCH --cpus-per-task=1'''
  '''#SBATCH --cpus-per-task=1'''
 
*'''Apabila ingin Hybrid MPI/OMP,''' isi kedua parameter tersebut:
* Apabila ingin Hybrid MPI/OMP maka isi kedua parameter tersebut. Perlu diingat bahwa total core CPU yang digunakan adalah ntasks * cpus-per-task. Contoh berikut menggunakan 2 proses MPI dan 4 thread OMP per MPI sehingga total menggunakan 8 core CPU:  
**Total core CPU yang digunakan adalah '''ntasks * cpus-per-task'''.
 
**Contoh menggunakan 2 proses MPI dan 4 thread OMP per MPI sehingga total menggunakan 8 core CPU:
  ''# Hybrid MPI/OMP, contoh dengan 2 proses MPI dan 4 thread OMP per MPI.''
  ''# Hybrid MPI/OMP, contoh dengan 2 proses MPI dan 4 thread OMP per MPI.''
  '''#SBATCH --ntasks=2'''
  '''#SBATCH --ntasks=2'''
  '''#SBATCH --cpus-per-task=4'''
  '''#SBATCH --cpus-per-task=4'''
 
*'''Apabila ingin OMP saja,''' isi jumlah ntasks dengan 1:
* Apabila ingin Pure OMP maka isi jumlah ntasks dengan 1.
 
  ''# Pure OMP''  
  ''# Pure OMP''  
  '''#SBATCH --ntasks=1'''
  '''#SBATCH --ntasks=1'''
  '''#SBATCH --cpus-per-task='''''<isi-sesuai-keinginan>''
  '''#SBATCH --cpus-per-task='''''[isi-sesuai-keinginan]''
=='''Pilihan Menjalankan Komputasi'''==
User dapat memilih metode menjalankan komputasi sesuai keinginan: ''<small>(klik expand / kembangkan)</small>''
*'''Job submission terminal'''
** ''Berjalan di [[Spesifikasi ALELEON Supercomputer#Spesifikasi%20Compute%20Node|compute node]] melalui manajemen Slurm.''
* '''Job submission web EFIRO'''
**''Berjalan di [[Spesifikasi ALELEON Supercomputer#Spesifikasi%20Compute%20Node|compute node]] melalui manajemen Slurm via web EFIRO.''
===Job Submission Terminal===
{| class="wikitable mw-collapsible mw-collapsed"
!Langkah Job Submission Terminal
[[Berkas:Sbatch Terminal.png|tepi|400x400px]]
|-
!1
|-
| Lakukan [https: / wiki.efisonlt.com wiki Menggunakan_ALELEON_Supercomputer_via_Terminal#1_ |'''[https://wiki.efisonlt.com/wiki/Menggunakan_ALELEON_Supercomputer_via_Terminal#Login_SSH Login SSH]''' ke ALELEON Supercomputer.
|-
!2
|-
| Siapkan file komputasi yang dibutuhkan.


== '''Menjalankan DFTB+''' ==
* File input dftb_in.hsd yang dibuat user.
User dapat menjalankan DFTB+ dengan pilihan cara menjalankan komputasi:


===[[Menggunakan ALELEON Supercomputer via EFIRO#3A%20-%20Menjalankan%20Komputasi%20ke%20Compute%20Node%20via%20Job%20Composer|EFIRO Job Composer]]===
*User dapat upload / download file dengan [[Upload File dengan Aplikasi FTP|'''software FTP''']].
Menjalankan komputasi dengan tampilan grafis pada formulir job submission EFIRO Job Composer. Berikut adalah pilihan template DFTB+ yang tersedia:
|-
{| class="wikitable"
! 3A
!Nama Template
|-
!Penjelasan
|Buat '''Submit Script''' yaitu 'formulir' untuk menjalankan job komputasi.
 
* Nama file bebas dengan format .sh, contoh '''<code>submit.sh</code>'''
|-
!
|-
|Contoh template Submit Script, ikuti petunjuk NOTES didalamnya.
*''<small>Klik expand / kembangkan</small>''
{| class="wikitable mw-collapsible mw-collapsed"
!Template Submit Script DFTB+
|-
|-
|DFTB+ 22.2 (CPU)
|<syntaxhighlight lang="bash" line="1">
|Menjalankan DFTB+ 22.2 versi CPU
#!/bin/bash
|}
 
Setelah membuat ruang job, user dapat mengupload atau membuat file input dftb_in.hsd melalui menu '''Edit Files''' ''(lihat langkah tutorial Job Composer no 4).''
# -----------------------------------------------------
# Template SLURM Submit Script
# DFTB+ | rev.080124
#
# NOTES:
# 1. Isi bagian yang ditandai 4 garing (////).
# 2. Template ini bersifat referensi.
#    User dapat mengubah bagian yang perlu diubah.
# 3. Perhatikan rate CCH = ntasks * cpus-per-task.
# -----------------------------------------------------
 
# -----------------------------------------------------
# Alokasi komputasi SBATCH, input, dan module
# -----------------------------------------------------
 
# Alokasi jumlah core thread CPU. mewakili jumlah task MPI
#SBATCH --ntasks=////
 
# Alokasi jumlah thread OMP per task MPI
#SBATCH --cpus-per-task=////
 
# Alokasi jumlah memori RAM (satuan GB)
#SBATCH --mem=////GB
 
# Alokasi limit waktu menjalankan job
# Format HH:MM:SS atau D-HH:MM:SS
#SBATCH --time=////
 
# Definisi file untuk menampung output terminal
#SBATCH --output=result-%j.txt
 
# Definisi file untuk menampung output error log   
#SBATCH --error=error-%j.txt
 
# Memuat modul software DFTB+
# Daftar modul lihat subbab "Modul DFTB+" di atas
module load dftbplus////


===[[Menggunakan ALELEON Supercomputer via Terminal#3%20-%20Menjalankan%20Komputasi%20ke%20Compute%20Node%20via%20SLURM|SLURM sbatch via Terminal]]===
# ----------------------------------------------------
Menjalankan komputasi pada terminal melalui job submission SLURM sbatch dengan ketentuan:
# Script jalannya program
# ----------------------------------------------------


* User wajib menaruh file input DFTB+ dftb_in.hsd pada satu direktori dengan SLURM Submit Script yang akan dibuat.
# Definisi threading OMP
* Berikut adalah contoh referensi Submit Script untuk menjalankan DFTB+:
export OMP_NUM_THREADS=${SLURM_CPUS_PER_TASK}


{| class="wikitable"
# Perintah menjakankan DFTB+
!Contoh SLURM Submit Script DFTB+
mpirun -np ${SLURM_NTASKS} dftb+
</syntaxhighlight>
|}
|-
|-
|
|
  #!/bin/bash
*''<small>Info script lebih detail lihat [[Submit Script ALELEON Supercomputer|'''Submit Script ALELEON Supercomputer''']].</small>''
 
*''<small>Untuk SBATCH notifikasi email status jalannya job lihat [https://wiki.efisonlt.com/wiki/Submit_Script_ALELEON_Supercomputer#SBATCH_untuk_notifikasi_email_SLURM '''Slurm Jojo'''].</small>''
|-
!3B
|-
|'''SBATCH komputasi (ntasks, mem, time, dll) mempunyai limit''' berdasarkan:
*Sisa Core Hour user dan [[Limitasi Fair Usage ALELEON Supercomputer|'''Fair Usage Limit''']].
*Spesifikasi sistem dan software komputasi.
Untuk melihat limit, jalankan perintah berikut:
  '''$ slimit-hympi'''
|-
!4
|-
|Jalankan job komputasi dengan perintah:
$ '''sbatch ''[nama-submit-script]'''''
   
   
  # ------------------------------------------------------------------------
  ''Contoh:''
# | Template SLURM Submit Script
$ sbatch submit.sh
# | Software        : DFTB+
|-
# | Versi          : tergantung input user
!5
# | Update script  r: 11/04/2023
|-
# |
|User dapat melihat status jalannya job dengan perintah:
# | NOTES:
'''<code>$ squeue -ul $USER</code>'''
# | 1. Isi bagian yang ditandai 4 garing (////).
{| class="wikitable"
# | 2. Template ini adalah referensi - user dapat mengubah bagian yang
! colspan="2" |''Kolom ST atau STATE menunjukkan status jalannya job.''
# |   sekiranya perlu diubah.
|-
# | 3. Panduan mengisi alokasi komputasi (SBATCH) menurut spesifikasi
! STATE
# |   ALELEON Supercomputer lihat:
! Penjelasan
# |   <nowiki>https://wiki.efisonlt.com/wiki/Submit_Script_ALELEON_Supercomputer</nowiki>
|-
# ------------------------------------------------------------------------
| R (RUN)
|Job berjalan
|-
|PD (PENDING)
|Job tertahan, lihat [[Daftar Reason NODELIST ALELEON Supercomputer|'''NODELIST(REASON)''']]
|-
| CG (COMPLETING)
|Job selesai dan dalam proses clean-up
|-
|CA (CANCELED)
|Job dibatalkan user
|-
|PR (PREEMPETED)
|Job dibatalkan admin, alasan dikabarkan via email
|-
|S (SUSPENDED)
|Job ditahan admin, alasan dikabarkan via email
|}
|-
!
|-
|Apabila user ingin menghentikan job yang berjalan, jalankan perintah:
'''$ scancel ''[job-ID]'''''
   
   
  # --------------------------------------------------
  ''Job ID ada pada squeue diatas.''
  # Alokasi komputasi, modul software, dan file input
  contoh membatalkan job ID 231:
  # --------------------------------------------------
  $ scancel 231
|}
# Alokasi jumlah compute node
===Job Submission Web EFIRO===
#SBATCH --nodes=////
{| class="wikitable mw-collapsible mw-collapsed"
!Langkah Job Submission Web EFIRO
  # Alokasi jumlah core thread CPU. mewakili jumlah task MPI
[[Berkas:Efirojobcomposer3.png|nirbing|400x400px]]
#SBATCH --ntasks=////
|-
!1
# Alokasi jumlah thread OMP per task MPI
|-
#SBATCH --cpus-per-task=////
| Lakukan [https: / wiki.efisonlt.com wiki Menggunakan_ALELEON_Supercomputer_via_Terminal#1_ |'''[https://wiki.efisonlt.com/wiki/Menggunakan_ALELEON_Supercomputer_via_EFIRO#Login_Web_EFIRO Login ke web EFIRO]''' ALELEON Supercomputer.
|-
# Alokasi jumlah memori RAM (satuan GB)
! 2
#SBATCH --mem=////GB
|-
|[[Berkas:New Pinnedapps jc.png|nirbing|128x128px]]Buka pinned apps '''Job Composer''' di homepage EFIRO.
# Alokasi limit waktu menjalankan job, format HH:MM:SS atau D-HH:MM:SS
Pilih menu '''<code>New Job</code>''' -> '''<code>From Template</code>'''
#SBATCH --time=////
 
[[Berkas:Jcnewjobmarked.png|nirbing|180x180px]]
# Definisi file untuk menampung output terminal
|-
#SBATCH --output=result-%j.txt
! 3
|-
# Definisi file untuk menampung output error log   
|
#SBATCH --error=error-%j.txt
{| class="wikitable"
! colspan="2" |'''Pilih template DFTB+ yang diinginkan:'''
# Memuat modul software DFTB+, pilih nama modul pada tabel dibawah ini
|-
module load dftbplus////
!Nama Template
!Penjelasan
# DAFTAR MODUL DFTB+:
|-
# -----------------------------------------------------
| DFTB+ 22.2
# | Nama modul                          | Versi DFTB+ |
| Menjalankan DFTB+ versi 22.2
  # -----------------------------------------------------
|}Isi '''<code>Job Name</code>''' dan klik '''<code>Create New Job</code>'''
# | dftbplus/22.2-GCC11.3-AOCL4.0      | 22.2 (CPU)  |
 
# -----------------------------------------------------
[[Berkas:Jctemplate-2.png|nirbing]]
|-
# -------------------------------------------------
!4
# RUN SCRIPT
|-
# -------------------------------------------------
|Siapkan file komputasi yang dibutuhkan:
* File input dftb_in.hsd yang dibuat user.
# Definisi threading OMP
* Upload / download / edit file via menu <code>'''Edit Files'''</code>
export OMP_NUM_THREADS=$SLURM_CPUS_PER_TASK
**Untuk upload file tunggal diatas 2GB gunakan [[Upload File dengan Aplikasi FTP|'''software FTP''']].
[[Berkas:JC job menu.png|nirbing|500x500px]]
# Perintah menjakankan DFTB+
|-
mpirun -np $SLURM_NTASKS --mca pml ucx --mca osc ucx dftb+
!5A
|-
|Lengkapi '''Submit Script''' melalui tombol '''<code>Open Editor:</code>'''
*Submit script adalah 'formulir' untuk menjalankan job komputasi.
**Ikuti petunjuk NOTES didalamnya.
*Klik '''<code>Save</code>''' setiap kali mengubah script.
[[Berkas:Jceditor3.png|al=|nirbing|400x400px]]
|-
|
*''<small>Info script lebih detail lihat [[Submit Script ALELEON Supercomputer|'''Submit Script ALELEON Supercomputer''']].</small>''
*''<small>Untuk SBATCH notifikasi email status jalannya job lihat [https://wiki.efisonlt.com/wiki/Submit_Script_ALELEON_Supercomputer#SBATCH_untuk_notifikasi_email_SLURM '''Slurm Jojo'''].</small>''
|-
!5B
|-
|SBATCH komputasi (ntasks, mem, time, dll) '''mempunyai limit''' berdasarkan:
*Sisa Core Hour user dan [[Limitasi Fair Usage ALELEON Supercomputer|'''Fair Usage Limit''']].
*Spesifikasi sistem dan software komputasi.
Untuk melihat limit, jalankan perintah ini via menu '''<code>Open Terminal</code>''':
  '''$ slimit-hympi'''
|-
!6
|-
|Jalankan job dengan klik tombol '''<code>Submit</code>'''.
*Pantau kolom status yang menjelaskan status jalannya job.
*Apabila ingin membatalkan job yang berjalan, klik '''<code>Stop</code>'''.
[[Berkas:JC job runstop.png|al=|nirbing|500x500px]]
{| class="wikitable"
! colspan="2" |Daftar Status Job
|-
!Status
!Arti
|-
|Not Submitted
|Job belum pernah dijalankan.
|-
|Running
|Job berjalan.
|-
|Queue
|Job mengantri dan belum berjalan.
|-
| Completed
|Job selesai berjalan.
|-
|Failed
|Job berhenti karena error atau di stop user.
|-
| colspan="2" |'''''Untuk melihat alasan job yang queue:'''''[[Berkas:Active Jobs detail.png|nir|jmpl|300x300px|''Buka pinned apps '''Active Jobs''' di homepage EFIRO. Ubah opsi All jobs ke '''Your Jobs'''. Klik simbol '''>''' untuk melihat status job yang pending pada kolom Reason. Arti reason lihat laman [[Daftar Reason NODELIST ALELEON Supercomputer|'''Daftar Reason NODELIST ALELEON Supercomputer''']].'']]
|}
|-
!7
|-
|Lihat output file komputasi pada kolom '''<code>Folder Contents</code>'''
*Atau dengan membuka menu '''<code>Edit Files</code>'''
[[Berkas:Jcfoldercontentsedit.png|al=|nir|jmpl|''Kolom '''<code>Folder Contents</code>'''.'']]
|-
!8
|-
|Untuk menghapus ruang job dan datanya:
*Pilih ruang job yang akan dihapus.
*Klik menu '''<code>Delete</code>'''
[[Berkas:JC delete menu.png|nirbing|500x500px]]
|}
|}
=='''Notifikasi Status Jalannya Job Submission via email'''==
== '''Pelaporan Kendala dan Support'''==
SLURM ALELEON Supercomputer dapat mengirim notifikasi email kepada user '''untuk mengabarkan apabila job user sudah berjalan atau selesai'''. SLURM ALELEON Supercomputer menggunakan nama email '''Jojo''' untuk mengirim notifikasi email.
Apabila menjumpai masalah teknis dalam menjalankan komputasi, silahkan lapor dengan klik gambar berikut ini.
 
[[Berkas:Wiki-pelaporankendala.jpg|1000x1000px|link=https://efisonlt.com/aleleonbugreport]]
 
---


Silahkan tambahan SBATCH berikut pada SLURM Submit Script (dapat ditambahkan setelah SBATCH error) apabila user ingin menerima notifikasi email dari SLURM:
Bila terdapat pertanyaan lainnya, silahkan hubungi admin EFISON melalui email:
  #SBATCH --mail-user=<''alamat-email-user''>
  '''support@efisonlt.com'''
#SBATCH --mail-type=begin
#SBATCH --mail-type=end
*'''mail-user'''
**Alamat email user untuk menerima notifikasi SLURM
*'''mail-type=begin'''
**Notifikasi email yang menginfokan job sudah berjalan.
*'''mail-type=end'''
**Notifikasi email yang menginfokan job sudah selesai.
**Sekaligus memberikan cuplikan 20 baris terakhir dari file output SBATCH output dan error job user.

Revisi terkini sejak 30 September 2024 03.52

DFTB logo.png

DFTB+ adalah software package yang versatil untuk simulasi mechanical quantum. DFTB+ merupakan software tidak berbayar dengan lisensi GNU Lesser General Public License.

Modul DFTB+

Berikut adalah detail versi DFTB+ yang tersedia secara global di ALELEON Supercomputer:

Versi Nama modul Dukungan hardware
CPU GPU OMP

Threading

MPI

multi-node

22.2 dftbplus/22.2-GCC11.3-AOCL4.0 V - V V

Menyiapkan File Slaster-Koster (SK)

File input DFTB+ membutuhkan file Slater-Koster (SK) pada bagian Hamiltonian yang bisa didapatkan pada tautan berikut. File dalam format .tar sehingga perlu di ekstrak.

Admin menyarankan menaruh / upload folder SK pada direktori HOME supaya dapat diakses oleh banyak job.

$HOME/<folder-file-SK-yang-dibutuhkan>

Pastikan file input dftb_in.hsd pada bagian Hamiltonian menunjuk direktori file SK spesifik pada HOME tersebut.

File Input dftb_in.hsd

User membuat file input DFTB+ dengan nama file dftb_in.hsd.

  • Pastikan bagian Hamiltonian di file input menunjuk direktori file SK yang tepat.

Pilihan MPI atau Threading OpenMP untuk Menjalankan DFTB+

DFTB+ di ALELEON Supercomputer dapat berjalan melalui paralelisasi MPI, OpenMP (OMP), atau keduanya (hybrid MPI/OMP) untuk menggunakan multi-core CPU dan multi-node. Admin menyerahkan keputusan kepada user untuk memilih metode paralelisasi melalui parameter Submit Script berikut:

  • Penjelasan submit script lihat subbab berikutnya (Pilihan Menjalankan Komputasi).
  • SBATCH ntasks mewakili jumlah task MPI sedangkan SBATCH cpus-per-task mewakili jumlah thread OMP.
#SBATCH --ntasks -> mewakili jumlah task MPI
#SBATCH --cpus-per-task -> mewakili jumlah thread OpenMP
  • Apabila ingin MPI saja, isi jumlah SBATCH cpus-per-task dengan 1:
# Pure MPI 
#SBATCH --ntasks=[isi-sesuai-keinginan]
#SBATCH --cpus-per-task=1
  • Apabila ingin Hybrid MPI/OMP, isi kedua parameter tersebut:
    • Total core CPU yang digunakan adalah ntasks * cpus-per-task.
    • Contoh menggunakan 2 proses MPI dan 4 thread OMP per MPI sehingga total menggunakan 8 core CPU:
# Hybrid MPI/OMP, contoh dengan 2 proses MPI dan 4 thread OMP per MPI.
#SBATCH --ntasks=2
#SBATCH --cpus-per-task=4
  • Apabila ingin OMP saja, isi jumlah ntasks dengan 1:
# Pure OMP 
#SBATCH --ntasks=1
#SBATCH --cpus-per-task=[isi-sesuai-keinginan]

Pilihan Menjalankan Komputasi

User dapat memilih metode menjalankan komputasi sesuai keinginan: (klik expand / kembangkan)

  • Job submission terminal
  • Job submission web EFIRO
    • Berjalan di compute node melalui manajemen Slurm via web EFIRO.

Job Submission Terminal

Langkah Job Submission Terminal

Sbatch Terminal.png

1
Login SSH ke ALELEON Supercomputer.
2
Siapkan file komputasi yang dibutuhkan.
  • File input dftb_in.hsd yang dibuat user.
3A
Buat Submit Script yaitu 'formulir' untuk menjalankan job komputasi.
  • Nama file bebas dengan format .sh, contoh submit.sh
Contoh template Submit Script, ikuti petunjuk NOTES didalamnya.
  • Klik expand / kembangkan
Template Submit Script DFTB+
#!/bin/bash

# -----------------------------------------------------
# Template SLURM Submit Script
# DFTB+ | rev.080124
# 
# NOTES: 
# 1. Isi bagian yang ditandai 4 garing (////).
# 2. Template ini bersifat referensi.
#    User dapat mengubah bagian yang perlu diubah.
# 3. Perhatikan rate CCH = ntasks * cpus-per-task.
# -----------------------------------------------------

# -----------------------------------------------------
# Alokasi komputasi SBATCH, input, dan module
# -----------------------------------------------------

# Alokasi jumlah core thread CPU. mewakili jumlah task MPI
#SBATCH --ntasks=////

# Alokasi jumlah thread OMP per task MPI
#SBATCH --cpus-per-task=////

# Alokasi jumlah memori RAM (satuan GB)
#SBATCH --mem=////GB

# Alokasi limit waktu menjalankan job
# Format HH:MM:SS atau D-HH:MM:SS 
#SBATCH --time=////

# Definisi file untuk menampung output terminal
#SBATCH --output=result-%j.txt

# Definisi file untuk menampung output error log    
#SBATCH --error=error-%j.txt 

# Memuat modul software DFTB+
# Daftar modul lihat subbab "Modul DFTB+" di atas 
module load dftbplus////

# ----------------------------------------------------
# Script jalannya program
# ----------------------------------------------------

# Definisi threading OMP 
export OMP_NUM_THREADS=${SLURM_CPUS_PER_TASK}

# Perintah menjakankan DFTB+
mpirun -np ${SLURM_NTASKS} dftb+
  • Untuk SBATCH notifikasi email status jalannya job lihat Slurm Jojo.
3B
SBATCH komputasi (ntasks, mem, time, dll) mempunyai limit berdasarkan:
  • Sisa Core Hour user dan Fair Usage Limit.
  • Spesifikasi sistem dan software komputasi.

Untuk melihat limit, jalankan perintah berikut:

$ slimit-hympi
4
Jalankan job komputasi dengan perintah:
$ sbatch [nama-submit-script]

Contoh:
$ sbatch submit.sh
5
User dapat melihat status jalannya job dengan perintah:

$ squeue -ul $USER

Kolom ST atau STATE menunjukkan status jalannya job.
STATE Penjelasan
R (RUN) Job berjalan
PD (PENDING) Job tertahan, lihat NODELIST(REASON)
CG (COMPLETING) Job selesai dan dalam proses clean-up
CA (CANCELED) Job dibatalkan user
PR (PREEMPETED) Job dibatalkan admin, alasan dikabarkan via email
S (SUSPENDED) Job ditahan admin, alasan dikabarkan via email
Apabila user ingin menghentikan job yang berjalan, jalankan perintah:
$ scancel [job-ID]

Job ID ada pada squeue diatas.
contoh membatalkan job ID 231:
$ scancel 231

Job Submission Web EFIRO

Langkah Job Submission Web EFIRO

Efirojobcomposer3.png

1
Login ke web EFIRO ALELEON Supercomputer.
2
New Pinnedapps jc.pngBuka pinned apps Job Composer di homepage EFIRO.

Pilih menu New Job -> From Template

Jcnewjobmarked.png

3
Pilih template DFTB+ yang diinginkan:
Nama Template Penjelasan
DFTB+ 22.2 Menjalankan DFTB+ versi 22.2
Isi Job Name dan klik Create New Job

Jctemplate-2.png

4
Siapkan file komputasi yang dibutuhkan:
  • File input dftb_in.hsd yang dibuat user.
  • Upload / download / edit file via menu Edit Files

JC job menu.png

5A
Lengkapi Submit Script melalui tombol Open Editor:
  • Submit script adalah 'formulir' untuk menjalankan job komputasi.
    • Ikuti petunjuk NOTES didalamnya.
  • Klik Save setiap kali mengubah script.

5B
SBATCH komputasi (ntasks, mem, time, dll) mempunyai limit berdasarkan:
  • Sisa Core Hour user dan Fair Usage Limit.
  • Spesifikasi sistem dan software komputasi.

Untuk melihat limit, jalankan perintah ini via menu Open Terminal:

$ slimit-hympi
6
Jalankan job dengan klik tombol Submit.
  • Pantau kolom status yang menjelaskan status jalannya job.
  • Apabila ingin membatalkan job yang berjalan, klik Stop.

Daftar Status Job
Status Arti
Not Submitted Job belum pernah dijalankan.
Running Job berjalan.
Queue Job mengantri dan belum berjalan.
Completed Job selesai berjalan.
Failed Job berhenti karena error atau di stop user.
Untuk melihat alasan job yang queue:
Buka pinned apps Active Jobs di homepage EFIRO. Ubah opsi All jobs ke Your Jobs. Klik simbol > untuk melihat status job yang pending pada kolom Reason. Arti reason lihat laman Daftar Reason NODELIST ALELEON Supercomputer.
7
Lihat output file komputasi pada kolom Folder Contents
  • Atau dengan membuka menu Edit Files
Kolom Folder Contents.
8
Untuk menghapus ruang job dan datanya:
  • Pilih ruang job yang akan dihapus.
  • Klik menu Delete

JC delete menu.png

Pelaporan Kendala dan Support

Apabila menjumpai masalah teknis dalam menjalankan komputasi, silahkan lapor dengan klik gambar berikut ini.

Wiki-pelaporankendala.jpg

---

Bila terdapat pertanyaan lainnya, silahkan hubungi admin EFISON melalui email:

support@efisonlt.com