PHASE/0: Perbedaan antara revisi

Dari ALELEON by EFISON
(italic deskripsi gambar)
(update phase 2023.01 dan formatting)
Baris 17: Baris 17:
multi-node
multi-node
|-
|-
|2021.01
|2023.01
|phase0/2021.01-3D-GCC10-MKL-FFTW3-LibM
|phase0/2023.01.01-3D-OneAPI
|V
|V
| -
| -
| -
| -
|V
|V
|}
=='''Metode Menjalankan Komputasi'''==
User dapat memilih metode menjalankan komputasi sesuai keinginan:
* '''Job submission terminal'''
** ''Berjalan di [[Spesifikasi ALELEON Supercomputer#Spesifikasi%20Compute%20Node|compute node]] melalui manajemen Slurm.''
* '''Job submission web EFIRO'''
** ''Berjalan di [[Spesifikasi ALELEON Supercomputer#Spesifikasi%20Compute%20Node|compute node]] melalui manajemen Slurm via web EFIRO.''
===Job Submission Terminal===
{| class="wikitable mw-collapsible mw-collapsed"
!Langkah Job Submission Terminal
[[Berkas:Sbatch Terminal.png|tepi|400x400px]]
|-
!1
|-
| Lakukan [https: / wiki.efisonlt.com wiki Menggunakan_ALELEON_Supercomputer_via_Terminal#1_ |'''[https://wiki.efisonlt.com/wiki/Menggunakan_ALELEON_Supercomputer_via_Terminal#Login_SSH Login SSH]''' ke ALELEON Supercomputer.
|-
|-
|2021.02
!2
|phase0/2021.02-3D-GCC11-MKL-FFTW3-LibM
|V
| -
| -
|V
|}
{| class="wikitable"
|+Modul PHASE/0 untuk ekcal
! rowspan="2" |Versi
! rowspan="2" |Nama modul software
! colspan="4" |Dukungan hardware
|-
|-
!CPU
|Siapkan file komputasi yang dibutuhkan.
!GPU
*User dapat upload / download file dengan [[Upload File dengan Aplikasi FTP|'''software FTP''']].
!OMP
Threading
!MPI
multi-node
|-
|-
|2021.02
!3A
|phase0/2021.02-3D-GCC11-MKL-FFTW3-LibM
|V
| -
| -
|V
|}
=='''Menjalankan PHASE/0'''==
User dapat menjalankan komputasi dengan pilihan cara melalui terminal atau website EFIRO ''(klik expand atau kembangkan)''.
===Opsi Menggunakan terminal (SLURM sbatch)===
{| class="wikitable mw-collapsible mw-collapsed"
! colspan="2" |Langkah Menjalankan PHASE/0 di Terminal
[[Berkas:Sbatch Terminal.png|nirbing|500x500px]]
|-
|-
|'''0'''
| Buat '''Submit Script''' yaitu 'formulir' untuk menjalankan job komputasi.
|
*Nama file bebas dengan format .sh, contoh '''<code>submit.sh</code>'''
==== Login SSH ====
Tatacara login SSH lihat laman [https://wiki.efisonlt.com/wiki/Menggunakan_ALELEON_Supercomputer_via_Terminal#1_|_Login_SSH '''Login SSH ALELEON Supercomputer'''].
|-
|-
|'''1'''
!
|
=====Menyiapkan File Komputasi=====
Siapkan file yang dibutuhkan untuk komputasi user, rekomendasi dalam satu folder per job:
*File input dan data komputasi.
**User dapat upload / download file ke ALELEON dengan [[Upload File dengan Aplikasi FTP|'''software FTP''']].
*Membuat '''SLURM Submit Script''' yaitu 'formulir' untuk menjalankan job komputasi.
**Nama script bebas dengan format file .sh (bash), contoh ''<code>my_job_submission.sh</code>''
|-
|-
| rowspan="2" |'''2'''
|Contoh template Submit Script, ikuti petunjuk NOTES didalamnya.
|
=====Template SLURM Submit Script PHASE/0=====
Ikuti panduan template berikut dan petunjuk NOTES di dalamnya.
{| class="wikitable mw-collapsible mw-collapsed"
{| class="wikitable mw-collapsible mw-collapsed"
!Template SLURM Submit Script untuk PHASE/0 versi phase
!Template PHASE/0 versi phase
|-
|-
|<syntaxhighlight lang="bash" line="1">
|<syntaxhighlight lang="bash" line="1">
Baris 125: Baris 103:
|}
|}
{| class="wikitable mw-collapsible mw-collapsed"
{| class="wikitable mw-collapsible mw-collapsed"
!Template SLURM Submit Script untuk PHASE/0 versi ekcal  
!Template PHASE/0 versi ekcal  
|-
|-
|<syntaxhighlight lang="bash" line="1">
|<syntaxhighlight lang="bash" line="1">
Baris 172: Baris 150:
</syntaxhighlight>
</syntaxhighlight>
|}
|}
|-
!
|-
|-
|
|
=====Panduan Nilai Maksimal SBATCH untuk PHASE/0=====
*''Info script lebih detail lihat [[Submit Script ALELEON Supercomputer|'''Submit Script ALELEON Supercomputer''']].''
{| class="wikitable mw-collapsible mw-collapsed"
*''Untuk SBATCH notifikasi email status jalannya job lihat [https://wiki.efisonlt.com/wiki/Submit_Script_ALELEON_Supercomputer#SBATCH_untuk_notifikasi_email_SLURM '''Slurm Jojo'''].''
! colspan="5" |Panduan Nilai Maksimal SBATCH ntasks, mem, gpus, time
|-
|-
!Skenario Komputasi
!3B
!ntasks
(CPU)
!mem
(RAM)
!gpus
(GPU)
!time
(time limit)
|-
|-
|Fair policy usage untuk akumulasi semua job<sup>''1''</sup>
| '''SBATCH komputasi (ntasks, mem, time, dll) mempunyai limit''' berdasarkan:*Sisa Core Hour user dan [[Limitasi Fair Usage ALELEON Supercomputer|'''Fair Usage Limit''']].
|128
*Spesifikasi sistem dan software komputasi.
|128GB
Untuk melihat limit, jalankan perintah berikut:
|2
'''$ slimit-mpi'''
| rowspan="3" |3-00:00:00
atau
 
72:00:00
|-
|-
|PHASE/0 versi CPU''<sup>2</sup>''
!4
|384
|240GB''<sup>2</sup>''
|0
|-
|-
|PHASE/0 versi CPU di high-mem node
|Jalankan job komputasi dengan perintah:
*Tambahkan <code>#SBATCH --nodelist=epyc001</code>
$ '''sbatch ''[nama-submit-script]'''''
|128
|500GB
''Contoh:''
|0
$ sbatch submit.sh
|-
|-
| colspan="5" |'''''Keterangan:'''''
! 5
#Limitasi untuk menjaga kualitas layanan ALELEON Supercomputer.
#*User dapat mengajukan permintaan buka limitasi apabila butuh alokasi lebih.
#*Info detail buka laman [[Limitasi Fair Usage ALELEON Supercomputer|'''Limitasi Fair Usage ALELEON Supercomputer''']]
#PHASE/0 mendukung komputasi paralel MPI. Ketika jumlah ntasks lebih dari 128:
#*SLURM otomatis menjalankan job pada multi-node.
#*Parameter mem adalah alokasi memori RAM per-node.
#*Info detail buka laman [[MPI ALELEON Supercomputer|'''MPI ALELEON Supercomputer''']].
|-
|-
! colspan="5" |Keterangan tambahan
|User dapat melihat status jalannya job dengan perintah:
|-
'''<code>$ squeue -ul $USER</code>'''
| colspan="5" |
{| class="wikitable mw-collapsible mw-collapsed"
*'''Untuk akun perseorangan dengan Kredit Core Hour:'''
! colspan="2" |Daftar ST (STATE) menunjukkan status jalannya job:
**SLURM akan menahan job apabila:
***ntasks * time (jam) lebih besar dari sisa CPU Core Hour user.
***gpus * time (jam) lebih besar dari sisa GPU Hour user.
**Cek sisa Kredit Core Hour melalui perintah:
$ '''sausage'''
*Info SBATCH lebih detail lihat laman [[Submit Script ALELEON Supercomputer|'''Submit Script ALELEON Supercomputer''']]
|}
|-
|-
|'''3'''
! STATE
|
=====Menjalankan Job Komputasi=====
Jalankan job dengan perintah sbatch.
$ '''sbatch''' '''''<nama-SLURM-Submit-script>'''''
Contoh menjalankan nama script <code>my_job_submission.sh</code>.
$ sbatch my_job_submission.sh
|-
|'''4A'''
|User dapat melihat status jalannya job dengan perintah squeue berikut.
*Apabila tidak ada output artinya tidak ada job user yang berjalan / antri pada waktu itu.
$ '''squeue -ul $USER'''
Berikut adalah daftar STATE (ST) dari squeue yang menunjukkan status berjalannya job:
{| class="wikitable"
|+Daftar STATE squeue SLURM
!STATE
!Kepanjangan
!Penjelasan
!Penjelasan
|-
|-
|R
|R (RUN)
|RUN
|Job berjalan
|Job berjalan
|-
|-
|PD
|PD (PENDING)
|PENDING
|Job tertahan, lihat [[Daftar Reason NODELIST ALELEON Supercomputer|'''NODELIST(REASON)''']]
|Job tertahan, lihat keterangan [[Daftar Reason NODELIST ALELEON Supercomputer|'''NODELIST(REASON)''']]
|-
|-
|CG
|CG (COMPLETING)
|COMPLETING
|Job selesai dan dalam proses clean-up
|Job selesai dan dalam proses clean-up SLURM
|-
|-
|CA
|CA (CANCELED)
|CANCELED
|Job dibatalkan user  
|Job dibatalkan oleh user
|-
|-
|PR
|PR (PREEMPETED)
|PREEMPETED
| Job dibatalkan admin, alasan dikabarkan via email
|Job dibatalkan oleh admin EFISON, alasan dikabarkan melalui email
|-
|-
|S
|S (SUSPENDED)
|SUSPENDED
|Job ditahan admin, alasan dikabarkan via email
|Job ditahan oleh admin EFISON
|}
|}
|-
|-
|'''4B'''
!
|
|-
=====Menghentikan Job Komputasi=====
|Apabila user ingin menghentikan job yang berjalan, jalankan perintah:
Apabila user ingin membatalkan job, gunakan perintah scancel berdasarkan job ID.
  '''$ scancel ''[job-ID]'''''
*Job ID dapat dilihat melalui perintah squeue pada kolom JOBID.
*User hanya bisa membatalkan job submission milik user sendiri.
''Job ID ada pada squeue diatas.''
  $ '''scancel <''job-ID-submission-user''>'''
contoh membatalkan job ID 231:
Contoh user membatalkan job submission milik user dengan ID 231.
  $ scancel 231
  $ scancel 231
|}
|}
===Opsi Menggunakan Web EFIRO (EFIRO Job Composer)===
 
=== Job Submission Web EFIRO ===
{| class="wikitable mw-collapsible mw-collapsed"
{| class="wikitable mw-collapsible mw-collapsed"
! colspan="2" |Langkah Menjalankan PHASE/0 di Web EFIRO
!Langkah Job Submission Web EFIRO
[[Berkas:Efirojobcomposer3.png|nirbing|500x500px]]
[[Berkas:Efirojobcomposer3.png|nirbing|400x400px]]
|-
!1
|-
| [https: / wiki.efisonlt.com wiki Menggunakan_ALELEON_Supercomputer_via_EFIRO#1_ |'''[https://wiki.efisonlt.com/wiki/Menggunakan_ALELEON_Supercomputer_via_EFIRO#Login_Web_EFIRO Login ke web EFIRO]''' ALELEON Supercomputer.
|-
!2
|-
|Buka pinned apps '''Job Composer''' [[Berkas:New Pinnedapps jc.png|nirbing|128x128px]] di homepage EFIRO.
Pilih menu '''<code>New Job</code>''' -> '''<code>From Template</code>'''
 
[[Berkas:Jcnewjobmarked.png|nirbing|180x180px]]
|-
|-
|'''0'''
!3
|
=====Login Web EFIRO=====
*[[Koneksi VPN ALELEON Supercomputer|'''User harus terhubung ke jaringan VPN ALELEON Supercomputer''']].
*Buka alamat web '''<code><nowiki>http://aleleon.ood</nowiki></code>'''  lalu masukkan username dan password user.
**Bagi user Linux, buka alamat <code>'''<nowiki>http://10.192.50.11</nowiki>'''</code>
|-
|-
|'''1'''
|
|
=====Membuka Job Composer dan Memilih Template Job=====
*Buka menu '''<code>Jobs</code>''' > '''<code>Jobs Composer</code>''' pada dashboard EFIRO.
*Pilih '''<code>New Job</code>''' > '''<code>From Template</code>'''
[[Berkas:Efirojobcomposermenu.png|nir|jmpl|''Menu '''<code>Jobs</code> > <code>Jobs Composer</code>''''']][[Berkas:Jcnewjobmarked.png|al=|nir|jmpl|220x220px|''Menu '''<code>New Jobs</code>''' > '''<code>From Template</code>''''']]
|-
|'''2'''
|[[Berkas:Jcselecttemplate3.png|nirbing|600x600px]]
*PIlih template PHASE/0 yang diinginkan.
*Isi atau ganti kolom '''<code>Job Name</code>''' sesuai keinginan user.
*Apabila sudah selesai, klik '''<code>Create New Job</code>'''.
{| class="wikitable"
{| class="wikitable"
! colspan="2" |Template PHASE/0 yang tersedia
! colspan="2" |Pilih template PHASE/0 yang diinginkan
|-
|-
!Nama Template
!Nama Template
!Penjelasan
!Penjelasan
|-
|-
|PHASE/0 2021.01
|PHASE/0 2023.01
|Menjalankan PHASE/0 2021.01
|Menjalankan PHASE/0 2023.01
|-
|PHASE/0 2021.02
|Menjalankan PHASE/0 2021.02
|-
|PHASE/0 2021.02 ekcal
|Menjalankan PHASE/0 2021.02 dengan ekcal
|}
|-
|-
|'''3'''
|PHASE/0 2023.01 ekcal
|
|Menjalankan PHASE/0 2023.01 dengan ekcal
=====Menyiapkan File Komputasi=====
|}Kemudian Isi '''<code>Job Name</code>''' dan klik '''<code>Create New Job</code>'''
[[Berkas:Jcjoboption3.png|nirbing|600x600px]]


Gunakan menu <code>'''Edit Files'''</code> untuk upload file komputasi yang dibutuhkan.
[[Berkas:Jctemplate-2.png|nirbing]]  
*Laman Edit Files juga dapat melakukan download / edit / rename / delete file.
*Fitur upload pada Edit Files mempunyai limit kapasitas '''2GB per file'''.
**Gunakan [[Upload File dengan Aplikasi FTP|'''aplikasi FTP''']] untuk upload file tunggal diatas 2GB.
|-
|-
| rowspan="2" |'''4'''
! 4
|
=====Melengkapi Submit Script=====
Submit Script adalah "formulir" untuk menjalankan job komputasi user.
*Lengkapi Submit Script melalui menu '''<code>Open Editor</code>'''.
*Ikuti petunjuk NOTES di dalamnya.
*Jangan lupa klik <code>'''Save'''</code> setiap sekali mengubah script.
[[Berkas:Jceditor3.png|al=|nirbing|500x500px]]
|-
|-
|
|Siapkan conda env dan file komputasi yang dibutuhkan.
=====Panduan Nilai Maksimal SBATCH=====
[[Berkas:Jcjoboption.png|nirbing|400x400px]]
{| class="wikitable mw-collapsible mw-collapsed"
*Upload file melalui menu '''<code>Edit Files</code>'''
! colspan="5" |Panduan Nilai Maksimal SBATCH ntasks, mem, gpus, time
**Untuk upload file tunggal diatas 2GB gunakan [[Upload File dengan Aplikasi FTP|'''software FTP''']].
* Pembuatan conda env di terminal melalui menu <code>'''Open Terminal'''</code>.
|-
|-
!Skenario Komputasi
!5A
!ntasks
(CPU)
!mem
(RAM)
!gpus
(GPU)
!time
(time limit)
|-
|-
|Fair policy usage untuk akumulasi semua job<sup>''1''</sup>
|Lengkapi '''Submit Script''' melalui tombol '''<code>Open Editor</code>'''.
|128
[[Berkas:Jceditor3.png|al=|nirbing|400x400px]]
|128GB
*Submit script adalah 'formulir' untuk menjalankan job komputasi.
|2
*Ikuti petunjuk NOTES didalamnya
| rowspan="3" |3-00:00:00
*Klik '''<code>Save</code>''' setiap kali mengubah script.
atau
 
72:00:00
|-
|-
|PHASE/0 versi CPU''<sup>2</sup>''
!
|384
|240GB''<sup>2</sup>''
|0
|-
|-
|PHASE/0 versi CPU di high-mem node
|
*Tambahkan <code>#SBATCH --nodelist=epyc001</code>
*''Info script lebih detail lihat [[Submit Script ALELEON Supercomputer|'''Submit Script ALELEON Supercomputer''']].''
|128
*''Untuk SBATCH notifikasi email status jalannya job lihat [https://wiki.efisonlt.com/wiki/Submit_Script_ALELEON_Supercomputer#SBATCH_untuk_notifikasi_email_SLURM '''Slurm Jojo'''].''
|500GB
|0
|-
|-
| colspan="5" |'''''Keterangan:'''''
!5B
#Limitasi untuk menjaga kualitas layanan ALELEON Supercomputer.
#*User dapat mengajukan permintaan buka limitasi apabila butuh alokasi lebih.
#*Info detail buka laman [[Limitasi Fair Usage ALELEON Supercomputer|'''Limitasi Fair Usage ALELEON Supercomputer''']]
#PHASE/0 mendukung komputasi paralel MPI. Ketika jumlah ntasks lebih dari 128:
#*SLURM otomatis menjalankan job pada multi-node.
#*Parameter mem adalah alokasi memori RAM per-node.
#*Info detail buka laman [[MPI ALELEON Supercomputer|'''MPI ALELEON Supercomputer''']].
|-
|-
| colspan="5" |'''''Keterangan:'''''
|'''SBATCH komputasi (ntasks, mem, time, dll) mempunyai limit''' berdasarkan:
#Limitasi untuk menjaga kualitas layanan ALELEON Supercomputer.
* Sisa Core Hour user dan [[Limitasi Fair Usage ALELEON Supercomputer|'''Fair Usage Limit''']].
#*User dapat mengajukan permintaan buka limitasi apabila butuh alokasi lebih.
*Spesifikasi sistem dan software komputasi.
#*Info detail buka laman [[Limitasi Fair Usage ALELEON Supercomputer|'''Limitasi Fair Usage ALELEON Supercomputer''']]
Untuk melihat limit, jalankan perintah berikut pada terminal:
#PHASE/0 mendukung komputasi paralel MPI. Ketika jumlah ntasks lebih dari 128:
'''$ slimit-python'''
#*SLURM otomatis menjalankan job pada multi-node.
#*Parameter mem adalah alokasi memori RAM per-node.
#*Info detail buka laman [[MPI ALELEON Supercomputer|'''MPI ALELEON Supercomputer''']].
#Berdasarkan rekomendasi dokumentasi PHASE/0.
|-
|-
! colspan="5" |Keterangan tambahan
!6
|-
|-
| colspan="5" |
|Jalankan job dengan klik tombol '''<code>Submit</code>'''.
*'''Untuk akun perseorangan dengan Kredit Core Hour:'''
[[Berkas:Jcsubmit2.png|al=|nirbing|400x400px]]
**SLURM akan menahan job apabila:
*Pantau kolom status yang menjelaskan status jalannya job.
***ntasks * time (jam) lebih besar dari sisa CPU Core Hour user.
*Apabila ingin membatalkan job yang berjalan, klik '''<code>Stop</code>'''.
***gpus * time (jam) lebih besar dari sisa GPU Hour user.
*Job completed dapat dijalankan kembali dengan '''<code>Submit</code>'''.
**Cek sisa Kredit Core Hour melalui menu '''<code>Open Terminal</code>''' dan jalankan perintah:
{| class="wikitable mw-collapsible mw-collapsed"
$ '''sausage'''
! colspan="2" |Daftar status job:
[[Berkas:Jcjoboption4.png|nirbing|600x600px]]
*Info SBATCH lebih detail lihat laman [[Submit Script ALELEON Supercomputer|'''Submit Script ALELEON Supercomputer''']]
|}
|-
|-
|'''5'''
|
=====Menjalankan Job Komputasi=====
Jalankan job dengan klik tombol '''<code>Submit</code>'''.
[[Berkas:Jcsubmit2.png|al=|nirbing|600x600px]]
{| class="wikitable"
|+''Penjelasan kolom '''<code>Status</code>,''' pantau dengan refresh halaman job''
!Status
!Status
!Arti
!Arti
Baris 424: Baris 292:
|-
|-
|Running
|Running
|Job berjalan.
| Job berjalan.
|-
|-
|Queue
|Queue
|Job mengantri dan belum berjalan.
|Job mengantri dan belum berjalan.
{| class="wikitable mw-collapsible mw-collapsed"
!Langkah melihat status job ketika queue
|-
|-
|Buka <code>'''Jobs > Active Jobs'''</code> pada dashboard EFIRO.
|Completed
*Lakukan langkah sesuai gambar dibawah ini
| Job selesai berjalan.
[[Berkas:Efiroqueueedit.png|al=|jmpl|''Halaman Active Jobs. Ubah opsi '''<code>Your jobs</code>''' untuk melihat status job user saja. Klik simbol '''>''' untuk melihat status  job pending pada kolom '''Reason'''. Arti reason lihat laman '''[[Daftar Reason NODELIST ALELEON Supercomputer]].'''''|kiri]]
|}
|-
|-
|Completed
| Failed
|Job selesai berjalan.
|Job berhenti di tengah jalan, antara error atau di stop user
|-
|-
|Failed
| colspan="2" | '''Untuk melihat alasan queue:'''
|Job berhenti di tengah jalan, bisa karena di Stop atau Delete oleh user.
#Buka app '''<code>Active Jobs</code>''' [[Berkas:Pinnedapps activejobs.png|nirbing|127x127px]]di homepage EFIRO.
#[[Berkas:Efiroqueueedit.png|nir|jmpl|''Ubah opsi '''<code>Your jobs</code>''' untuk melihat status job user saja. Klik simbol '''>''' untuk melihat status  job pending pada kolom '''Reason'''. Arti reason lihat laman '''[[Daftar Reason NODELIST ALELEON Supercomputer]].''''']]
|}
|}
=====Menghentikan Job Komputasi=====
Untuk menghentikan job yang tengah berjalan, klik tombol '''<code>Stop</code>'''.
[[Berkas:Stop.png|nirbing|600x600px]]
|-
|-
|'''6A'''
!7
|
|-
=====Melihat Output Komputasi=====
|Lihat output file komputasi pada kolom '''<code>Folder Contents</code>'''
User dapat melihat output file komputasi pada kolom '''<code>Folder Contents</code>'''
*Atau dengan membuka '''<code>Edit Files</code>'''
*Atau dengan membuka '''<code>Edit Files</code>'''
[[Berkas:Jcfoldercontentsedit.png|al=|nir|jmpl|''Kolom '''<code>Folder Contents</code>'''.'']]
[[Berkas:Jcfoldercontentsedit.png|al=|nir|jmpl|''Kolom '''<code>Folder Contents</code>'''.'']]  
|-
|'''6B'''
|User dapat '''menjalankan ulang ruang job yang sama''' dengan mengklik kembali tombol '''<code>Submit</code>'''.
|}
|}
=='''Notifikasi Status Jalannya Komputasi via email'''==
SLURM ALELEON Supercomputer dapat mengirim notifikasi email kepada user dengan nama "Jojo" untuk mengabarkan status berjalannya job komputasi user. Silahkan tambahan SBATCH berikut pada Submit Script apabila user ingin menerima notifikasi email dari SLURM:<syntaxhighlight lang="bash">
#SBATCH --mail-user=<alamat-email-user>
#SBATCH --mail-type=BEGIN,END,FAIL
</syntaxhighlight>SBATCH mail-type mengatur konten email notifikasi SLURM dengan pilihan opsi yang sekiranya berguna untuk user:
*BEGIN -> notifikasi job sudah mulai
*END -> notifikasi job sudah selesai beserta cuplikan 20 baris terakhir dari file SBATCH output dan error.
*FAIL -> notifikasi apabila job gagal berjalan atau berhenti tidak sewajarnya.
*TIME_LIMIT_50 -> job telah berjalan dengan durasi waktu 50% time limit.
*TIME_LIMIT_80 -> job telah berjalan dengan durasi waktu 80% time limit.
=='''Pelaporan Kendala dan Support'''==
=='''Pelaporan Kendala dan Support'''==
Apabila menjumpai masalah teknis dalam menjalankan komputasi, silahkan lapor dengan klik gambar berikut ini.
Apabila menjumpai masalah teknis dalam menjalankan komputasi, silahkan lapor dengan klik gambar berikut ini.

Revisi per 4 Juni 2024 17.20

Phase-logo4.png

PHASE/0 adalah program untuk menghitung struktur elektronik yang berbasis DFT (density functional theory) dan skema pseudopotensial. Program ini dapat memperkirakan ciri fisik dari material yang tidak ditemukan dalam percobaan apapun dengan ketepatan tinggi.

Modul PHASE/0

Berikut adalah detail versi PHASE/0 yang tersedia secara global di ALELEON Supercomputer:

Modul PHASE/0 untuk phase
Versi Nama modul software Dukungan hardware
CPU GPU OMP

Threading

MPI

multi-node

2023.01 phase0/2023.01.01-3D-OneAPI V - - V

Metode Menjalankan Komputasi

User dapat memilih metode menjalankan komputasi sesuai keinginan:

  • Job submission terminal
  • Job submission web EFIRO
    • Berjalan di compute node melalui manajemen Slurm via web EFIRO.

Job Submission Terminal

Langkah Job Submission Terminal

Sbatch Terminal.png

1
Login SSH ke ALELEON Supercomputer.
2
Siapkan file komputasi yang dibutuhkan.
3A
Buat Submit Script yaitu 'formulir' untuk menjalankan job komputasi.
  • Nama file bebas dengan format .sh, contoh submit.sh
Contoh template Submit Script, ikuti petunjuk NOTES didalamnya.
Template PHASE/0 versi phase
#!/bin/bash

# -----------------------------------------------------
# Template SLURM Submit Script
# PHASE/0 | rev.080124
# 
# NOTES: 
# 1. Isi bagian yang ditandai 4 garing (////).
# 2. Template ini bersifat referensi.
#    User dapat mengubah bagian yang perlu diubah.
# -----------------------------------------------------

# -----------------------------------------------------
# Alokasi komputasi SBATCH, input, dan module
# -----------------------------------------------------

# Alokasi jumlah core thread CPU
#SBATCH --ntasks=////

# Alokasi jumlah memori RAM (satuan GB)
#SBATCH --mem=////GB

# Alokasi limit waktu menjalankan job
# Format HH:MM:SS atau D-HH:MM:SS
#SBATCH --time=////

# Definisi file untuk menampung output terminal program
#SBATCH --output=result-%j.txt

# Definisi file untuk menampung output error log    
#SBATCH --error=error-%j.txt 

# Memuat modul software PHASE/0
# Daftar modul lihat subbab "Modul PHASE/0" di atas 
module load phase0////

# ----------------------------------------------------
# Script jalannya program
# ----------------------------------------------------

# Perintah menjakankan PHASE/0
mpirun -np ${SLURM_NTASKS} phase
Template PHASE/0 versi ekcal
#!/bin/bash

# -----------------------------------------------------
# Template SLURM Submit Script
# PHASE/0 ekcal | rev.080124
# 
# NOTES: 
# 1. Isi bagian yang ditandai 4 garing (////).
# 2. Template ini bersifat referensi.
#    User dapat mengubah bagian yang perlu diubah.
# -----------------------------------------------------

# -----------------------------------------------------
# Alokasi komputasi SBATCH, input, dan module
# -----------------------------------------------------

# Alokasi jumlah core thread CPU
#SBATCH --ntasks=////

# Alokasi jumlah memori RAM (satuan GB)
#SBATCH --mem=////GB

# Alokasi limit waktu menjalankan job
# Format HH:MM:SS atau D-HH:MM:SS
#SBATCH --time=////

# Definisi file untuk menampung output terminal program
#SBATCH --output=result-%j.txt

# Definisi file untuk menampung output error log    
#SBATCH --error=error-%j.txt 

# Memuat modul software PHASE/0
# Daftar modul lihat subbab "Modul PHASE/0" di atas 
module load phase0////

# ----------------------------------------------------
# Script jalannya program
# ----------------------------------------------------

# Perintah menjakankan PHASE/0
mpirun -np ${SLURM_NTASKS} ekcal
3B
SBATCH komputasi (ntasks, mem, time, dll) mempunyai limit berdasarkan:*Sisa Core Hour user dan Fair Usage Limit.
  • Spesifikasi sistem dan software komputasi.

Untuk melihat limit, jalankan perintah berikut:

$ slimit-mpi 
4
Jalankan job komputasi dengan perintah:
$ sbatch [nama-submit-script]

Contoh:
$ sbatch submit.sh
5
User dapat melihat status jalannya job dengan perintah:

$ squeue -ul $USER

Daftar ST (STATE) menunjukkan status jalannya job:
STATE Penjelasan
R (RUN) Job berjalan
PD (PENDING) Job tertahan, lihat NODELIST(REASON)
CG (COMPLETING) Job selesai dan dalam proses clean-up
CA (CANCELED) Job dibatalkan user
PR (PREEMPETED) Job dibatalkan admin, alasan dikabarkan via email
S (SUSPENDED) Job ditahan admin, alasan dikabarkan via email
Apabila user ingin menghentikan job yang berjalan, jalankan perintah:
$ scancel [job-ID]

Job ID ada pada squeue diatas.
contoh membatalkan job ID 231:
$ scancel 231

Job Submission Web EFIRO

Langkah Job Submission Web EFIRO

Efirojobcomposer3.png

1
Login ke web EFIRO ALELEON Supercomputer.
2
Buka pinned apps Job Composer New Pinnedapps jc.png di homepage EFIRO.

Pilih menu New Job -> From Template

Jcnewjobmarked.png

3
Pilih template PHASE/0 yang diinginkan
Nama Template Penjelasan
PHASE/0 2023.01 Menjalankan PHASE/0 2023.01
PHASE/0 2023.01 ekcal Menjalankan PHASE/0 2023.01 dengan ekcal
Kemudian Isi Job Name dan klik Create New Job

Jctemplate-2.png

4
Siapkan conda env dan file komputasi yang dibutuhkan.

Jcjoboption.png

  • Upload file melalui menu Edit Files
  • Pembuatan conda env di terminal melalui menu Open Terminal.
5A
Lengkapi Submit Script melalui tombol Open Editor.

  • Submit script adalah 'formulir' untuk menjalankan job komputasi.
  • Ikuti petunjuk NOTES didalamnya
  • Klik Save setiap kali mengubah script.
5B
SBATCH komputasi (ntasks, mem, time, dll) mempunyai limit berdasarkan:
  • Sisa Core Hour user dan Fair Usage Limit.
  • Spesifikasi sistem dan software komputasi.

Untuk melihat limit, jalankan perintah berikut pada terminal:

$ slimit-python
6
Jalankan job dengan klik tombol Submit.

  • Pantau kolom status yang menjelaskan status jalannya job.
  • Apabila ingin membatalkan job yang berjalan, klik Stop.
  • Job completed dapat dijalankan kembali dengan Submit.
Daftar status job:
Status Arti
Not Submitted Job belum pernah dijalankan.
Running Job berjalan.
Queue Job mengantri dan belum berjalan.
Completed Job selesai berjalan.
Failed Job berhenti di tengah jalan, antara error atau di stop user
Untuk melihat alasan queue:
  1. Buka app Active Jobs Pinnedapps activejobs.pngdi homepage EFIRO.
  2. Ubah opsi Your jobs untuk melihat status job user saja. Klik simbol > untuk melihat status job pending pada kolom Reason. Arti reason lihat laman Daftar Reason NODELIST ALELEON Supercomputer.
7
Lihat output file komputasi pada kolom Folder Contents
  • Atau dengan membuka Edit Files
Kolom Folder Contents.

Pelaporan Kendala dan Support

Apabila menjumpai masalah teknis dalam menjalankan komputasi, silahkan lapor dengan klik gambar berikut ini.

Wiki-pelaporankendala.jpg

---

Bila terdapat pertanyaan lainnya, silahkan hubungi admin EFISON melalui email:

support@efisonlt.com