OpenMX: Perbedaan antara revisi

Dari ALELEON by EFISON
(italic deskripsi gambar)
 
(7 revisi perantara oleh pengguna yang sama tidak ditampilkan)
Baris 31: Baris 31:
=== '''DATA.PATH pada File Input''' ===
=== '''DATA.PATH pada File Input''' ===
User wajib mendefinisikan DATA.PATH berikut pada file input supaya OpenMX dapat berjalan. Daftar DATA.PATH per versi OpenMX lihat tabel di bawah.  
User wajib mendefinisikan DATA.PATH berikut pada file input supaya OpenMX dapat berjalan. Daftar DATA.PATH per versi OpenMX lihat tabel di bawah.  
  DATA.PATH        ''<data-path-OpenMX>''
  DATA.PATH        ''[data-path-OpenMX]''
{| class="wikitable"
{| class="wikitable"
|+Daftar DATA.PATH OpenMX
|+Daftar DATA.PATH OpenMX
Baris 42: Baris 42:


== '''Pilihan MPI atau Threading OpenMP untuk Menjalankan OpenMX''' ==
== '''Pilihan MPI atau Threading OpenMP untuk Menjalankan OpenMX''' ==
OpenMX dapat berjalan melalui metode paralelisasi MPI, threading OpenMP (OMP), atau Hybrid MPI/OMP. ALELEON Supercomputer menyerahkan keputusan kepada user untuk memilih metode paralelisasi tersebut melalui konfigurasi pada SLURM Submit Script (''lihat subbab Menjalankan OpenMX''):
OpenMX di ALELEON Supercomputer dapat berjalan melalui paralelisasi '''MPI''', '''OpenMP''' (OMP), atau keduanya ('''hybrid MPI/OMP''') untuk menggunakan multi-core CPU dan multi-node. Admin menyerahkan keputusan kepada user untuk memilih metode paralelisasi melalui parameter Submit Script berikut:
*SBATCH ntasks mewakili jumlah task MPI sedangkan SBATCH cpus-per-task mewakili jumlah thread OMP.
*''Penjelasan submit script lihat subbab berikutnya (Pilihan Menjalankan Komputasi).''
*'''SBATCH ntasks mewakili jumlah task MPI sedangkan SBATCH cpus-per-task mewakili jumlah thread OMP.'''
  '''#SBATCH --ntasks''' ''-> mewakili jumlah task MPI''
  '''#SBATCH --ntasks''' ''-> mewakili jumlah task MPI''
  '''#SBATCH --cpus-per-task''' ''-> mewakili jumlah thread OpenMP''
  '''#SBATCH --cpus-per-task''' ''-> mewakili jumlah thread OpenMP''
*Apabila ingin Pure MPI maka isi jumlah SBATCH cpus-per-task dengan 1.
*'''Apabila ingin MPI saja,''' isi jumlah SBATCH cpus-per-task dengan 1:
  ''# Pure MPI''  
  ''# Pure MPI''  
  '''#SBATCH --ntasks='''''<isi-sesuai-keinginan>''
  '''#SBATCH --ntasks='''''[isi-sesuai-keinginan]''
  '''#SBATCH --cpus-per-task=1'''
  '''#SBATCH --cpus-per-task=1'''
*Apabila ingin Hybrid MPI/OMP maka isi kedua parameter tersebut. Perlu diingat bahwa total core CPU yang digunakan adalah ntasks * cpus-per-task. Contoh berikut menggunakan 2 proses MPI dan 4 thread OMP per MPI sehingga total menggunakan 8 core CPU:
*'''Apabila ingin Hybrid MPI/OMP,''' isi kedua parameter tersebut:
**Total core CPU yang digunakan adalah '''ntasks * cpus-per-task'''.
**Contoh menggunakan 2 proses MPI dan 4 thread OMP per MPI sehingga total menggunakan 8 core CPU:
  ''# Hybrid MPI/OMP, contoh dengan 2 proses MPI dan 4 thread OMP per MPI.''
  ''# Hybrid MPI/OMP, contoh dengan 2 proses MPI dan 4 thread OMP per MPI.''
  '''#SBATCH --ntasks=2'''
  '''#SBATCH --ntasks=2'''
  '''#SBATCH --cpus-per-task=4'''
  '''#SBATCH --cpus-per-task=4'''
*Apabila ingin Pure OMP maka isi jumlah ntasks dengan 1.
*'''Apabila ingin OMP saja,''' isi jumlah ntasks dengan 1:
  ''# Pure OMP''  
  ''# Pure OMP''  
  '''#SBATCH --ntasks=1'''
  '''#SBATCH --ntasks=1'''
  '''#SBATCH --cpus-per-task='''''<isi-sesuai-keinginan>''
  '''#SBATCH --cpus-per-task='''''[isi-sesuai-keinginan]''
=='''Menjalankan OpenMX'''==
=='''Metode Menjalankan Komputasi'''==
User dapat menjalankan komputasi dengan pilihan cara melalui terminal atau website EFIRO ''(klik expand atau kembangkan)''.
User dapat menjalankan OpenMX dengan pilihan metode:
===Opsi Menggunakan terminal (SLURM sbatch)===
 
=== Batch Job ===
Menjalankan komputasi di [[Spesifikasi ALELEON Supercomputer#Spesifikasi%20Compute%20Node|compute node]] melalui manajemen Slurm kemudian user menunggu hingga selesai. Terdapat dua opsi tampilan yang dapat dipilih sesuai preferensi user: ''<small>(klik expand atau kembangkan)</small>''
{| class="wikitable mw-collapsible mw-collapsed"
{| class="wikitable mw-collapsible mw-collapsed"
! colspan="2" |Langkah Menjalankan OpenMX di Terminal
!Langkah Job Submission Slurm di Terminal
[[Berkas:Sbatch Terminal.png|nirbing|500x500px]]
[[Berkas:Sbatch terminal display rev2.png|tepi|400x400px]]
|-
!1
|-
| Lakukan [https: / wiki.efisonlt.com wiki Menggunakan_ALELEON_Supercomputer_via_Terminal#1_ |'''[https://wiki.efisonlt.com/wiki/Menggunakan_ALELEON_Supercomputer_via_Terminal#Login_SSH Login SSH]''' ke ALELEON Supercomputer.
|-
|-
|'''0'''
!2
|
|-
=====Login SSH=====
| Siapkan file komputasi yang dibutuhkan.
Tatacara login SSH lihat laman [https://wiki.efisonlt.com/wiki/Menggunakan_ALELEON_Supercomputer_via_Terminal#1_|_Login_SSH '''Login SSH ALELEON Supercomputer'''].
*Perhatikan DATA.PATH pada file input.
*User dapat upload / download file dengan [[Upload File dengan Aplikasi FTP|'''software FTP''']].
|-
!3A
|-
|Buat '''Submit Script''' yaitu 'formulir' untuk menjalankan job komputasi.
*Nama file bebas dengan format .sh, contoh '''<code>submit.sh</code>'''
|-
|-
|'''1'''
!
|
=====Menyiapkan File Komputasi=====
Siapkan file yang dibutuhkan untuk komputasi user, rekomendasi dalam satu folder per job:
*File input dan data komputasi.
**User dapat upload / download file ke ALELEON dengan [[Upload File dengan Aplikasi FTP|'''software FTP''']].
*Membuat '''SLURM Submit Script''' yaitu 'formulir' untuk menjalankan job komputasi.
**Nama script bebas dengan format file .sh (bash), contoh ''<code>my_job_submission.sh</code>''
|-
|-
| rowspan="2" |'''2'''
|Contoh template Submit Script, ikuti petunjuk NOTES didalamnya.
|
 
=====Template SLURM Submit Script OpenMX=====
* <small>Klik expand / kembangkan</small>
Ikuti panduan template berikut dan petunjuk NOTES di dalamnya.
 
{| class="wikitable mw-collapsible mw-collapsed"
{| class="wikitable mw-collapsible mw-collapsed"
!Template SLURM Submit Script untuk OpenMX
!Template Submit Script OpenMX
|-
|-
|<syntaxhighlight lang="bash" line="1">
|<syntaxhighlight lang="bash" line="1">
Baris 143: Baris 151:
|-
|-
|
|
=====Panduan Nilai Maksimal SBATCH untuk OpenMX=====
* ''<small>Info script lebih detail lihat [[Submit Script ALELEON Supercomputer|'''Submit Script ALELEON Supercomputer''']].</small>''
{| class="wikitable mw-collapsible mw-collapsed"
! colspan="5" |Panduan Nilai Maksimal SBATCH ntasks, mem, gpus, time
|-
!Skenario Komputasi
! (CPU)''<sup>1</sup>''
!mem
(RAM)
!gpus
(GPU)
!time
(time limit)
|-
|Fair policy usage untuk akumulasi semua job<sup>''2''</sup>
|128
|128GB
|2
| rowspan="3" |3-00:00:00
atau


72:00:00
*''<small>Untuk SBATCH notifikasi email status jalannya job lihat [https://wiki.efisonlt.com/wiki/Submit_Script_ALELEON_Supercomputer#SBATCH_untuk_notifikasi_email_SLURM '''Slurm Jojo'''].</small>''
|-
|-
|OpenMX''<sup>3</sup>''
!3B
|384
|240GB''<sup>2</sup>''
|0
|-
|-
|OpenMX versi CPU di high-mem node
|'''SBATCH komputasi (ntasks, mem, time, dll) mempunyai limit''' berdasarkan:
 
*Sisa Core Hour user dan [[Limitasi Fair Usage ALELEON Supercomputer|'''Fair Usage Limit''']].
* Tambahkan <code>#SBATCH --nodelist=epyc001</code>
*Spesifikasi sistem dan software komputasi.
|128
Untuk melihat limit, jalankan perintah berikut:
|500GB
'''$ slimit-hympi'''
|0
|-
|-
| colspan="5" |'''''Keterangan:'''''
!4
# Jumlah CPU = ntasks * cpus-per-task
# Limitasi untuk menjaga kualitas layanan ALELEON Supercomputer.
#* User dapat mengajukan permintaan buka limitasi apabila butuh alokasi lebih.
#*Info detail buka laman [[Limitasi Fair Usage ALELEON Supercomputer|'''Limitasi Fair Usage ALELEON Supercomputer''']]
#OpenMX mendukung komputasi paralel MPI. Ketika jumlah ntasks lebih dari 128:
#*SLURM otomatis menjalankan job pada multi-node.
#*Parameter mem adalah alokasi memori RAM per-node.
#*Info detail buka laman [[MPI ALELEON Supercomputer|'''MPI ALELEON Supercomputer''']].
|-
|-
! colspan="5" |Keterangan tambahan
|Jalankan job komputasi dengan perintah:
$ '''sbatch ''[nama-submit-script]'''''
''Contoh:''
$ sbatch submit.sh
|-
|-
| colspan="5" |
!5
*'''Untuk akun perseorangan dengan Kredit Core Hour:'''
**SLURM akan menahan job apabila:
***ntasks * time (jam) lebih besar dari sisa CPU Core Hour user.
***gpus * time (jam) lebih besar dari sisa GPU Hour user.
**Cek sisa Kredit Core Hour melalui perintah:
$ '''sausage'''
*Info SBATCH lebih detail lihat laman [[Submit Script ALELEON Supercomputer|'''Submit Script ALELEON Supercomputer''']]
|}
|-
|-
|'''3'''
|User dapat melihat status jalannya job dengan perintah:
|
'''<code>$ squeue -ul $USER</code>'''
=====Menjalankan Job Komputasi=====
{| class="wikitable"
Jalankan job dengan perintah sbatch.
! colspan="2" |''Kolom ST atau STATE menunjukkan status jalannya job.''
$ '''sbatch''' '''''<nama-SLURM-Submit-script>'''''
Contoh menjalankan nama script <code>my_job_submission.sh</code>.
$ sbatch my_job_submission.sh
|-
|-
|'''4A'''
|User dapat melihat status jalannya job dengan perintah squeue berikut.
*Apabila tidak ada output artinya tidak ada job user yang berjalan / antri pada waktu itu.
$ '''squeue -ul $USER'''
Berikut adalah daftar STATE (ST) dari squeue yang menunjukkan status berjalannya job:
{| class="wikitable"
|+Daftar STATE squeue SLURM
!STATE
!STATE
!Kepanjangan
!Penjelasan
!Penjelasan
|-
|-
|R
|R (RUN)
|RUN
|Job berjalan
|Job berjalan
|-
|-
|PD
|PD (PENDING)
|PENDING
| Job tertahan, lihat [[Daftar Reason NODELIST ALELEON Supercomputer|'''NODELIST(REASON)''']]
|Job tertahan, lihat keterangan [[Daftar Reason NODELIST ALELEON Supercomputer|'''NODELIST(REASON)''']]
|-
|-
|CG
|CG (COMPLETING)
|COMPLETING
|Job selesai dan dalam proses clean-up
|Job selesai dan dalam proses clean-up SLURM
|-
|-
|CA
|CA (CANCELED)
|CANCELED
|Job dibatalkan user
|Job dibatalkan oleh user
|-
|-
|PR
|PR (PREEMPETED)
|PREEMPETED
|Job dibatalkan admin, alasan dikabarkan via email
|Job dibatalkan oleh admin EFISON, alasan dikabarkan melalui email
|-
|-
|S
| S (SUSPENDED)
|SUSPENDED
|Job ditahan admin, alasan dikabarkan via email
|Job ditahan oleh admin EFISON
|}
|}
|-
|-
|'''4B'''
!
|
|-
=====Menghentikan Job Komputasi=====
| Apabila user ingin menghentikan job yang berjalan, jalankan perintah:
Apabila user ingin membatalkan job, gunakan perintah scancel berdasarkan job ID.
  '''$ scancel ''[job-ID]'''''
*Job ID dapat dilihat melalui perintah squeue pada kolom JOBID.
*User hanya bisa membatalkan job submission milik user sendiri.
''Job ID ada pada squeue diatas.''
  $ '''scancel <''job-ID-submission-user''>'''
contoh membatalkan job ID 231:
Contoh user membatalkan job submission milik user dengan ID 231.
  $ scancel 231  
  $ scancel 231
|}
|}
===Opsi Menggunakan Web EFIRO (EFIRO Job Composer)===
{| class="wikitable mw-collapsible mw-collapsed"
{| class="wikitable mw-collapsible mw-collapsed"
! colspan="2" |Langkah Menjalankan OpenMX di Web EFIRO
! Langkah Job Submission Slurm di Web EFIRO
[[Berkas:Efirojobcomposer3.png|nirbing|500x500px]]
[[Berkas:Efiro jobcomposer display.png|nirbing|400x400px]]
|-
!1
|-
| Lakukan [https: / wiki.efisonlt.com wiki Menggunakan_ALELEON_Supercomputer_via_Terminal#1_ |'''[https://wiki.efisonlt.com/wiki/Menggunakan_ALELEON_Supercomputer_via_EFIRO#Login_Web_EFIRO Login ke web EFIRO]''' ALELEON Supercomputer.
|-
!2
|-
|-
|'''0'''
|[[Berkas:New Pinnedapps jc.png|nirbing|128x128px]]Buka pinned apps '''Job Composer''' di homepage EFIRO.
|
Pilih menu '''<code>New Job</code>''' -> '''<code>From Template</code>'''
=====Login Web EFIRO=====
 
*[[Koneksi VPN ALELEON Supercomputer|'''User harus terhubung ke jaringan VPN ALELEON Supercomputer''']].
[[Berkas:Jcnewjobmarked.png|nirbing|180x180px]]
*Buka alamat web '''<code><nowiki>http://aleleon.ood</nowiki></code>''' lalu masukkan username dan password user.
|-
**Bagi user Linux, buka alamat <code>'''<nowiki>http://10.192.50.11</nowiki>'''</code>
! 3
|-
|-
|'''1'''
|
|
=====Membuka Job Composer dan Memilih Template Job=====
*Buka menu '''<code>Jobs</code>''' > '''<code>Jobs Composer</code>''' pada dashboard EFIRO.
*Pilih '''<code>New Job</code>''' > '''<code>From Template</code>'''
[[Berkas:Efirojobcomposermenu.png|nir|jmpl|''Menu '''<code>Jobs</code> > <code>Jobs Composer</code>''''']][[Berkas:Jcnewjobmarked.png|al=|nir|jmpl|220x220px|''Menu '''<code>New Jobs</code>''' > '''<code>From Template</code>''''']]
|-
|'''2'''
|[[Berkas:Jcselecttemplate3.png|nirbing|600x600px]]
*PIlih template OpenMX yang diinginkan.
*Isi atau ganti kolom '''<code>Job Name</code>''' sesuai keinginan user.
*Apabila sudah selesai, klik '''<code>Create New Job</code>'''.
{| class="wikitable"
{| class="wikitable"
! colspan="2" |Template OpenMX yang tersedia
! colspan="2" |Pilih template OpenMX yang diinginkan:
|-
|-
!Nama Template
!Nama Template
Baris 285: Baris 235:
|OpenMX 3.9.9
|OpenMX 3.9.9
|Menjalankan OpenMX 3.9.9
|Menjalankan OpenMX 3.9.9
|}
|}Kemudian Isi '''<code>Job Name</code>''' dan klik '''<code>Create New Job</code>'''
 
[[Berkas:Jctemplate-2.png|nirbing]]
|-
|-
|'''3'''
! 4
|
=====Menyiapkan File Komputasi=====
[[Berkas:Jcjoboption3.png|nirbing|600x600px]]
 
Gunakan menu <code>'''Edit Files'''</code> untuk upload file komputasi yang dibutuhkan.
*Laman Edit Files juga dapat melakukan download / edit / rename / delete file.
*Fitur upload pada Edit Files mempunyai limit kapasitas '''2GB per file'''.
**Gunakan [[Upload File dengan Aplikasi FTP|'''aplikasi FTP''']] untuk upload file tunggal diatas 2GB.
|-
|-
| rowspan="2" |'''4'''
| Siapkan file komputasi yang dibutuhkan:
|
*Upload file melalui menu '''<code>Edit Files</code>'''
=====Melengkapi Submit Script=====
**Untuk upload file tunggal diatas 2GB gunakan [[Upload File dengan Aplikasi FTP|'''software FTP''']].
Submit Script adalah "formulir" untuk menjalankan job komputasi user.
*Perhatikan DATA.PATH pada file input.
*Lengkapi Submit Script melalui menu '''<code>Open Editor</code>'''.
[[Berkas:JC job menu.png|nirbing|500x500px]]
*Ikuti petunjuk NOTES di dalamnya.
*Jangan lupa klik <code>'''Save'''</code> setiap sekali mengubah script.
[[Berkas:Jceditor3.png|al=|nirbing|500x500px]]
|-
|-
|
!5A
=====Panduan Nilai Maksimal SBATCH=====
{| class="wikitable mw-collapsible mw-collapsed"
! colspan="5" |Panduan Nilai Maksimal SBATCH ntasks, mem, gpus, time
|-
|-
!Skenario Komputasi
|Lengkapi '''Submit Script''' melalui tombol '''<code>Open Editor</code>'''.
!(CPU)''<sup>1</sup>''
[[Berkas:Jceditor3.png|al=|nirbing|400x400px]]
!mem
*Submit script adalah 'formulir' untuk menjalankan job komputasi.
(RAM)
*Ikuti petunjuk NOTES didalamnya
!gpus
*Klik '''<code>Save</code>''' setiap kali mengubah script.
(GPU)
!time
(time limit)
|-
|-
|Fair policy usage untuk akumulasi semua job<sup>''2''</sup>
|
|128
*''<small>Info script lebih detail lihat [[Submit Script ALELEON Supercomputer|'''Submit Script ALELEON Supercomputer''']].</small>''
|128GB
*''<small>Untuk SBATCH notifikasi email status jalannya job lihat [https://wiki.efisonlt.com/wiki/Submit_Script_ALELEON_Supercomputer#SBATCH_untuk_notifikasi_email_SLURM '''Slurm Jojo'''].</small>''
|2
| rowspan="3" |3-00:00:00
atau
 
72:00:00
|-
|-
|OpenMX''<sup>3</sup>''
!5B
|384
|240GB''<sup>2</sup>''
|0
|-
|-
|OpenMX versi CPU di high-mem node
|'''SBATCH komputasi (ntasks, mem, time, dll) mempunyai limit''' berdasarkan:


* Tambahkan <code>#SBATCH --nodelist=epyc001</code>
* Sisa Core Hour user dan [[Limitasi Fair Usage ALELEON Supercomputer|'''Fair Usage Limit''']].
|128
*Spesifikasi sistem dan software komputasi.
|500GB
Untuk melihat limit, jalankan perintah berikut pada terminal:
|0
'''$ slimit-hympi'''
|-
|-
| colspan="5" |'''''Keterangan:'''''
!6
# Jumlah CPU = ntasks * cpus-per-task
# Limitasi untuk menjaga kualitas layanan ALELEON Supercomputer.
#* User dapat mengajukan permintaan buka limitasi apabila butuh alokasi lebih.
#*Info detail buka laman [[Limitasi Fair Usage ALELEON Supercomputer|'''Limitasi Fair Usage ALELEON Supercomputer''']]
#OpenMX mendukung komputasi paralel MPI. Ketika jumlah ntasks lebih dari 128:
#*SLURM otomatis menjalankan job pada multi-node.
#*Parameter mem adalah alokasi memori RAM per-node.
#*Info detail buka laman [[MPI ALELEON Supercomputer|'''MPI ALELEON Supercomputer''']].
|-
|-
! colspan="5" |Keterangan tambahan
|Jalankan job dengan klik tombol '''<code>Submit</code>'''.
*Pantau kolom status yang menjelaskan status jalannya job.
*Apabila ingin membatalkan job yang berjalan, klik '''<code>Stop</code>'''.
[[Berkas:JC job runstop.png|al=|nirbing|500x500px]]
{| class="wikitable"
! colspan="2" |Daftar status job
|-
|-
| colspan="5" |
*'''Untuk akun perseorangan dengan Kredit Core Hour:'''
**SLURM akan menahan job apabila:
***ntasks * time (jam) lebih besar dari sisa CPU Core Hour user.
***gpus * time (jam) lebih besar dari sisa GPU Hour user.
**Cek sisa Kredit Core Hour melalui menu '''<code>Open Terminal</code>''' dan jalankan perintah:
$ '''sausage'''
[[Berkas:Jcjoboption4.png|nirbing|600x600px]]
*Info SBATCH lebih detail lihat laman [[Submit Script ALELEON Supercomputer|'''Submit Script ALELEON Supercomputer''']]
|}
|-
|'''5'''
|
=====Menjalankan Job Komputasi=====
Jalankan job dengan klik tombol '''<code>Submit</code>'''.
[[Berkas:Jcsubmit2.png|al=|nirbing|600x600px]]
{| class="wikitable"
|+''Penjelasan kolom '''<code>Status</code>,''' pantau dengan refresh halaman job''
!Status
!Status
!Arti
! Arti
|-
|-
|Not Submitted
|Not Submitted
|Job belum pernah dijalankan.
|Job belum pernah dijalankan.
|-
|-
|Running
|Running  
|Job berjalan.
|Job berjalan.
|-
|-
|Queue
|Queue
|Job mengantri dan belum berjalan.
| Job mengantri dan belum berjalan.
{| class="wikitable mw-collapsible mw-collapsed"
!Langkah melihat status job ketika queue
|-
|Buka <code>'''Jobs > Active Jobs'''</code> pada dashboard EFIRO.
*Lakukan langkah sesuai gambar dibawah ini
[[Berkas:Efiroqueueedit.png|al=|jmpl|''Halaman Active Jobs. Ubah opsi '''<code>Your jobs</code>''' untuk melihat status job user saja. Klik simbol '''>''' untuk melihat status  job pending pada kolom '''Reason'''. Arti reason lihat laman '''[[Daftar Reason NODELIST ALELEON Supercomputer]].'''''|kiri]]
|}
|-
|-
|Completed
|Completed
Baris 395: Baris 293:
|-
|-
|Failed
|Failed
|Job berhenti di tengah jalan, bisa karena di Stop atau Delete oleh user.
|Job berhenti karena error atau di stop user.
|-
| colspan="2" |'''''Untuk melihat alasan job yang queue:'''''[[Berkas:Active Jobs detail.png|nir|jmpl|300x300px|''Buka pinned apps '''Active Jobs''' di homepage EFIRO. Ubah opsi All jobs ke '''Your Jobs'''. Klik simbol '''>''' untuk melihat status job yang pending pada kolom Reason. Arti reason lihat laman [[Daftar Reason NODELIST ALELEON Supercomputer|'''Daftar Reason NODELIST ALELEON Supercomputer''']].'']]
|}
|}
=====Menghentikan Job Komputasi=====
Untuk menghentikan job yang tengah berjalan, klik tombol '''<code>Stop</code>'''.
[[Berkas:Stop.png|nirbing|600x600px]]
|-
|-
|'''6A'''
!7
|
|-
=====Melihat Output Komputasi=====
|Lihat output file komputasi pada kolom '''<code>Folder Contents</code>'''
User dapat melihat output file komputasi pada kolom '''<code>Folder Contents</code>'''
* Atau dengan membuka '''<code>Edit Files</code>'''
*Atau dengan membuka '''<code>Edit Files</code>'''
[[Berkas:Jcfoldercontentsedit.png|al=|nir|jmpl|''Kolom '''<code>Folder Contents</code>'''.'']]
[[Berkas:Jcfoldercontentsedit.png|al=|nir|jmpl|''Kolom '''<code>Folder Contents</code>'''.'']]
|-
|-
|'''6B'''
!8
|User dapat '''menjalankan ulang ruang job yang sama''' dengan mengklik kembali tombol '''<code>Submit</code>'''.
|-
|Untuk menghapus ruang job dan datanya:
*Pilih ruang job yang akan dihapus.
*Klik menu '''<code>Delete</code>'''
[[Berkas:JC delete menu.png|nirbing|500x500px]]
|}
|}
=='''Notifikasi Status Jalannya Komputasi via email'''==
SLURM ALELEON Supercomputer dapat mengirim notifikasi email kepada user dengan nama "Jojo" untuk mengabarkan status berjalannya job komputasi user. Silahkan tambahan SBATCH berikut pada Submit Script apabila user ingin menerima notifikasi email dari SLURM:<syntaxhighlight lang="bash">
#SBATCH --mail-user=<alamat-email-user>
#SBATCH --mail-type=BEGIN,END,FAIL
</syntaxhighlight>SBATCH mail-type mengatur konten email notifikasi SLURM dengan pilihan opsi yang sekiranya berguna untuk user:
*BEGIN -> notifikasi job sudah mulai
*END -> notifikasi job sudah selesai beserta cuplikan 20 baris terakhir dari file SBATCH output dan error.
*FAIL -> notifikasi apabila job gagal berjalan atau berhenti tidak sewajarnya.
*TIME_LIMIT_50 -> job telah berjalan dengan durasi waktu 50% time limit.
*TIME_LIMIT_80 -> job telah berjalan dengan durasi waktu 80% time limit.
=='''Pelaporan Kendala dan Support'''==
=='''Pelaporan Kendala dan Support'''==
Apabila menjumpai masalah teknis dalam menjalankan komputasi, silahkan lapor dengan klik gambar berikut ini.
Apabila menjumpai masalah teknis dalam menjalankan komputasi, silahkan lapor dengan klik gambar berikut ini.

Revisi terkini sejak 18 Desember 2024 07.50

OpenMX Logo.png

OpenMX adalah software package untuk simulasi material skala nano berdasarkan DFT (Density Functional Theories), norm-conserving pseudopotensials, dan pseudo-atomic localized basis functinons. OpenMX merupakan software tidak berbayar dengan lisensi GNU GPLv3.

Modul OpenMX

Berikut adalah detail versi OpenMX yang tersedia secara global di ALELEON Supercomputer:

Modul OpenMX
Versi Nama modul Modul

DEFAULT

Dukungan hardware
CPU GPU OMP

Threading

MPI

multi-node

3.9.9 openmx/3.9.9-GCC11.3-AOCL4.0 V V - V V

DATA.PATH pada File Input

User wajib mendefinisikan DATA.PATH berikut pada file input supaya OpenMX dapat berjalan. Daftar DATA.PATH per versi OpenMX lihat tabel di bawah.

DATA.PATH        [data-path-OpenMX]
Daftar DATA.PATH OpenMX
Versi DATA.PATH
3.9.9 /comp/openmx/3.9.9-GCC11.3-AOCL4.0/DFT_DATA19

Pilihan MPI atau Threading OpenMP untuk Menjalankan OpenMX

OpenMX di ALELEON Supercomputer dapat berjalan melalui paralelisasi MPI, OpenMP (OMP), atau keduanya (hybrid MPI/OMP) untuk menggunakan multi-core CPU dan multi-node. Admin menyerahkan keputusan kepada user untuk memilih metode paralelisasi melalui parameter Submit Script berikut:

  • Penjelasan submit script lihat subbab berikutnya (Pilihan Menjalankan Komputasi).
  • SBATCH ntasks mewakili jumlah task MPI sedangkan SBATCH cpus-per-task mewakili jumlah thread OMP.
#SBATCH --ntasks -> mewakili jumlah task MPI
#SBATCH --cpus-per-task -> mewakili jumlah thread OpenMP
  • Apabila ingin MPI saja, isi jumlah SBATCH cpus-per-task dengan 1:
# Pure MPI 
#SBATCH --ntasks=[isi-sesuai-keinginan]
#SBATCH --cpus-per-task=1
  • Apabila ingin Hybrid MPI/OMP, isi kedua parameter tersebut:
    • Total core CPU yang digunakan adalah ntasks * cpus-per-task.
    • Contoh menggunakan 2 proses MPI dan 4 thread OMP per MPI sehingga total menggunakan 8 core CPU:
# Hybrid MPI/OMP, contoh dengan 2 proses MPI dan 4 thread OMP per MPI.
#SBATCH --ntasks=2
#SBATCH --cpus-per-task=4
  • Apabila ingin OMP saja, isi jumlah ntasks dengan 1:
# Pure OMP 
#SBATCH --ntasks=1
#SBATCH --cpus-per-task=[isi-sesuai-keinginan]

Metode Menjalankan Komputasi

User dapat menjalankan OpenMX dengan pilihan metode:

Batch Job

Menjalankan komputasi di compute node melalui manajemen Slurm kemudian user menunggu hingga selesai. Terdapat dua opsi tampilan yang dapat dipilih sesuai preferensi user: (klik expand atau kembangkan)

Langkah Job Submission Slurm di Terminal

Sbatch terminal display rev2.png

1
Login SSH ke ALELEON Supercomputer.
2
Siapkan file komputasi yang dibutuhkan.
  • Perhatikan DATA.PATH pada file input.
  • User dapat upload / download file dengan software FTP.
3A
Buat Submit Script yaitu 'formulir' untuk menjalankan job komputasi.
  • Nama file bebas dengan format .sh, contoh submit.sh
Contoh template Submit Script, ikuti petunjuk NOTES didalamnya.
  • Klik expand / kembangkan
Template Submit Script OpenMX
#!/bin/bash

# -----------------------------------------------------
# Template SLURM Submit Script
# OpenMX | rev.080124
# 
# NOTES: 
# 1. Isi bagian yang ditandai 4 garing (////).
# 2. Template ini bersifat referensi.
#    User dapat mengubah bagian yang perlu diubah.
# 3. Perhatikan rate CCH = ntasks * cpus-per-task.
# -----------------------------------------------------

# -----------------------------------------------------
# Alokasi komputasi SBATCH, input, dan module
# -----------------------------------------------------

# Alokasi jumlah core thread CPU, mewakili jumlah task MPI
#SBATCH --ntasks=////

# Alokasi jumlah thread OMP per task MPI
#SBATCH --cpus-per-task=////

# Alokasi jumlah memori RAM (satuan GB)
#SBATCH --mem=////GB

# Alokasi limit waktu menjalankan job
# Format HH:MM:SS atau D-HH:MM:SS
#SBATCH --time=////

# Definisi file untuk menampung output terminal program
#SBATCH --output=result-%j.txt

# Definisi file untuk menampung output error log    
#SBATCH --error=error-%j.txt 

# Nama input file OpenMX yang dijalankan
INPUT_FILE='////.dat'

# Memuat modul software OpenMX
# Daftar modul lihat subbab "Modul OpenMX" di atas 
module load openmx////

# ----------------------------------------------------
# Script jalannya program
# ----------------------------------------------------

# Definisi threading OMP 
export OMP_NUM_THREADS=${SLURM_CPUS_PER_TASK}

# Perintah menjakankan OpenMX
mpirun -np ${SLURM_NTASKS} openmx ${INPUT_FILE}
  • Untuk SBATCH notifikasi email status jalannya job lihat Slurm Jojo.
3B
SBATCH komputasi (ntasks, mem, time, dll) mempunyai limit berdasarkan:
  • Sisa Core Hour user dan Fair Usage Limit.
  • Spesifikasi sistem dan software komputasi.

Untuk melihat limit, jalankan perintah berikut:

$ slimit-hympi 
4
Jalankan job komputasi dengan perintah:
$ sbatch [nama-submit-script]

Contoh:
$ sbatch submit.sh
5
User dapat melihat status jalannya job dengan perintah:

$ squeue -ul $USER

Kolom ST atau STATE menunjukkan status jalannya job.
STATE Penjelasan
R (RUN) Job berjalan
PD (PENDING) Job tertahan, lihat NODELIST(REASON)
CG (COMPLETING) Job selesai dan dalam proses clean-up
CA (CANCELED) Job dibatalkan user
PR (PREEMPETED) Job dibatalkan admin, alasan dikabarkan via email
S (SUSPENDED) Job ditahan admin, alasan dikabarkan via email
Apabila user ingin menghentikan job yang berjalan, jalankan perintah:
$ scancel [job-ID]

Job ID ada pada squeue diatas.
contoh membatalkan job ID 231:
$ scancel 231 
Langkah Job Submission Slurm di Web EFIRO

Efiro jobcomposer display.png

1
Login ke web EFIRO ALELEON Supercomputer.
2
New Pinnedapps jc.pngBuka pinned apps Job Composer di homepage EFIRO.

Pilih menu New Job -> From Template

Jcnewjobmarked.png

3
Pilih template OpenMX yang diinginkan:
Nama Template Penjelasan
OpenMX 3.9.9 Menjalankan OpenMX 3.9.9
Kemudian Isi Job Name dan klik Create New Job

Jctemplate-2.png

4
Siapkan file komputasi yang dibutuhkan:
  • Upload file melalui menu Edit Files
  • Perhatikan DATA.PATH pada file input.

JC job menu.png

5A
Lengkapi Submit Script melalui tombol Open Editor.

  • Submit script adalah 'formulir' untuk menjalankan job komputasi.
  • Ikuti petunjuk NOTES didalamnya
  • Klik Save setiap kali mengubah script.
5B
SBATCH komputasi (ntasks, mem, time, dll) mempunyai limit berdasarkan:
  • Sisa Core Hour user dan Fair Usage Limit.
  • Spesifikasi sistem dan software komputasi.

Untuk melihat limit, jalankan perintah berikut pada terminal:

$ slimit-hympi
6
Jalankan job dengan klik tombol Submit.
  • Pantau kolom status yang menjelaskan status jalannya job.
  • Apabila ingin membatalkan job yang berjalan, klik Stop.

Daftar status job
Status Arti
Not Submitted Job belum pernah dijalankan.
Running Job berjalan.
Queue Job mengantri dan belum berjalan.
Completed Job selesai berjalan.
Failed Job berhenti karena error atau di stop user.
Untuk melihat alasan job yang queue:
Buka pinned apps Active Jobs di homepage EFIRO. Ubah opsi All jobs ke Your Jobs. Klik simbol > untuk melihat status job yang pending pada kolom Reason. Arti reason lihat laman Daftar Reason NODELIST ALELEON Supercomputer.
7
Lihat output file komputasi pada kolom Folder Contents
  • Atau dengan membuka Edit Files
Kolom Folder Contents.
8
Untuk menghapus ruang job dan datanya:
  • Pilih ruang job yang akan dihapus.
  • Klik menu Delete

JC delete menu.png

Pelaporan Kendala dan Support

Apabila menjumpai masalah teknis dalam menjalankan komputasi, silahkan lapor dengan klik gambar berikut ini.

Wiki-pelaporankendala.jpg

---

Bila terdapat pertanyaan lainnya, silahkan hubungi admin EFISON melalui email:

support@efisonlt.com