COMCOT: Perbedaan antara revisi

Dari ALELEON by EFISON
(→‎Menjalankan COMCOT: menambah opsi terminal / EFIRO)
(→‎Job Submission Web EFIRO: mengubah nama template)
 
(35 revisi perantara oleh pengguna yang sama tidak ditampilkan)
Baris 6: Baris 6:
! rowspan="2" |Versi
! rowspan="2" |Versi
! rowspan="2" |Nama modul  
! rowspan="2" |Nama modul  
! rowspan="2" |Modul
DEFAULT
! colspan="4" |Dukungan hardware
! colspan="4" |Dukungan hardware
|-
|-
Baris 19: Baris 17:
|1.7
|1.7
|comcot/1.7cpu
|comcot/1.7cpu
|V
|V
|V
| -
| -
Baris 25: Baris 22:
| -
| -
|}
|}
Hubungi tim admin melalui email '''support@efisonlt.com''' untuk permintaan instalasi versi lain.


== '''Menjalankan COMCOT''' ==
=='''Pilihan Menjalankan Komputasi'''==
User dapat menjalankan COMCOT dengan pilihan cara menjalankan komputasi via terminal atau EFIRO:
User dapat memilih metode menjalankan komputasi sesuai keinginan: ''<small>(klik expand / kembangkan)</small>''
*'''Job submission terminal'''
**''Berjalan di [[Spesifikasi ALELEON Supercomputer#Spesifikasi%20Compute%20Node|compute node]] melalui manajemen Slurm.''
*'''Job submission web EFIRO'''
**''Berjalan di [[Spesifikasi ALELEON Supercomputer#Spesifikasi%20Compute%20Node|compute node]] melalui manajemen Slurm via web EFIRO.''
=== Job Submission Terminal ===
{| class="wikitable mw-collapsible mw-collapsed"
!Langkah Job Submission Terminal
[[Berkas:Sbatch Terminal.png|tepi|400x400px]]
|-
!1
|-
| Lakukan [https: / wiki.efisonlt.com wiki Menggunakan_ALELEON_Supercomputer_via_Terminal#1_ |'''[https://wiki.efisonlt.com/wiki/Menggunakan_ALELEON_Supercomputer_via_Terminal#Login_SSH Login SSH]''' ke ALELEON Supercomputer.
|-
!2
|-
|Siapkan file komputasi yang dibutuhkan.
*User dapat upload / download file dengan [[Upload File dengan Aplikasi FTP|'''software FTP''']].
|-
!3A
|-
|Buat '''Submit Script''' yaitu 'formulir' untuk menjalankan job komputasi.
* Nama file bebas dengan format .sh, contoh '''<code>submit.sh</code>'''
|-
!
|-
|Contoh template Submit Script, ikuti petunjuk NOTES didalamnya.


=== Terminal - SLURM sbatch ===
* ''<small>Klik expand / kembangkan</small>''
[[Berkas:Sbatch Terminal.png|nirbing|500x500px]]


Menjalankan komputasi pada terminal melalui job submission SLURM sbatch. Tutorial ini mengasumsikan user dapat menggunakan terminal Linux.
{| class="wikitable mw-collapsible mw-collapsed"
{| class="wikitable mw-collapsible mw-collapsed"
! colspan="2" |Langkah Menjalankan COMCOT via SLURM sbatch
!Template Submit Script COMCOT
|-
|-
|'''0'''
|<syntaxhighlight lang="bash" line="1">
|Sebelum login, [[Koneksi VPN ALELEON Supercomputer|'''user harus terhubung ke jaringan VPN ALELEON Supercomputer''']]. Apabila sudah terhubung, login dengan SSH: 
#!/bin/bash


* User OS Windows dan MacOS -> <code>'''$ ssh <''username''>@aleleon.hpc'''</code>
# -----------------------------------------------------
* User OS Linux -> <code>'''$ ssh <''username''>@10.192.50.10'''</code>
# Template SLURM Submit Script
|-
# COMCOT | rev.080124
|'''1'''
#
|Siapkan file yang dibutuhkan untuk menjalankan komputasi user.
# NOTES:
# 1. Isi bagian yang ditandai 4 garing (////).
# 2. Template ini bersifat referensi.
#    User dapat mengubah bagian yang perlu diubah.
# -----------------------------------------------------
 
# -----------------------------------------------------
# Alokasi komputasi SBATCH, input, dan module
# -----------------------------------------------------
 
# Alokasi jumlah core thread CPU
#SBATCH --ntasks=////
 
# Alokasi jumlah memori RAM (satuan GB)
#SBATCH --mem=////GB
 
# Alokasi limit waktu menjalankan job
# Format HH:MM:SS atau D-HH:MM:SS
#SBATCH --time=////
 
# Definisi file untuk menampung output terminal program
#SBATCH --output=result-%j.txt
 
# Definisi file untuk menampung output error log   
#SBATCH --error=error-%j.txt
 
# Memuat modul software COMCOT
# Daftar modul lihat subbab "Modul COMCOT" di atas
module load comcot////
 
# ----------------------------------------------------
# Script jalannya program
# ----------------------------------------------------


* [[Upload File dengan Aplikasi FTP|'''User dapat melakukan upload / download file dengan bantuan aplikasi FTP''']] seperti FileZilla, WinSCP, dan lainnya.
# Perintah menjakankan COMCOT
* Untuk kerapian data, disarankan untuk menaruh satu job pada satu folder tersendiri.
comcot
</syntaxhighlight>
|}
|-
|-
|'''2'''
|
|Buat '''SLURM Submit Script''' yaitu semacam formulir untuk menjalankan job dengan panduan berikut:
* ''<small>Info script lebih detail lihat [[Submit Script ALELEON Supercomputer|'''Submit Script ALELEON Supercomputer''']].</small>''


* Nama script dibebaskan, contoh <code>slurmcomcot.sh</code>
*''<small>Untuk SBATCH notifikasi email status jalannya job lihat [https://wiki.efisonlt.com/wiki/Submit_Script_ALELEON_Supercomputer#SBATCH_untuk_notifikasi_email_SLURM '''Slurm Jojo'''].</small>''
* Ikuti panduan template berikut dan petunjuk pada NOTES didalamnya.
{| class="wikitable"
! colspan="3" |Panduan singkat mengisi SBATCH''<sup>1</sup>''
|-
|-
!Parameter
! 3B
!Nilai maks Fair policy usage''<sup>2</sup>''
!Nilai maks untuk COMCOT
|-
|-
|ntasks
|'''SBATCH komputasi (ntasks, mem, time, dll) mempunyai limit''' berdasarkan:
|128
 
|128
* Sisa Core Hour user dan [[Limitasi Fair Usage ALELEON Supercomputer|'''Fair Usage Limit''']].
|-
* Spesifikasi sistem dan software komputasi.
|mem
Untuk melihat limit, jalankan perintah berikut:
|128GB
'''$ slimit-ser'''
|500GB''<sup>3</sup>''
|-
|-
|time
!4
| colspan="2" |3-00:00:00 atau 72:00:00
|}
'''Note:'''
# Info semua SBATCH lebih detail lihat laman [[Submit Script ALELEON Supercomputer|'''Submit Script ALELEON Supercomputer''']]
# Info limitasi fair policy usage lihat laman [[Limitasi Fair Usage ALELEON Supercomputer|'''Limitasi Fair Usage ALELEON Supercomputer''']]
# User dapat menggunakan memori RAM hingga 500GB pada node epyc001. Tambahkan parameter <code>'''#SBATCH --nodelist=epyc001'''</code>
{| class="wikitable"
!Template SLURM Submit Script COMCOT
|-
|-
|
|Jalankan job komputasi dengan perintah:
  #!/bin/bash
  $ '''sbatch ''[nama-submit-script]'''''
   
   
  # -------------------------------------------------------------
  ''Contoh:''
# | Template SLURM Submit Script
  $ sbatch submit.sh
# | Software        : COMCOT (CPU)
# | Versi          : 1.7
# | Update script  r: 06/10/2023
# |
# | NOTES:
# | 1. Isi bagian yang ditandai 4 garing (////).
# | 2. Template ini adalah referensi.
# |    User dapat mengubah bagian yang sekiranya perlu diubah.
# | 3. Panduan menjalankan COMCOT di ALELEON lihat:
# |    [[COMCOT|https://wiki.efisonlt.com/wiki/COMCOT]]
# -------------------------------------------------------------
# --------------------------------------------------
# Alokasi komputasi, modul software, dan file input
# --------------------------------------------------
# Alokasi jumlah core thread CPU
#SBATCH --ntasks=////
# Alokasi jumlah memori RAM (satuan GB)
#SBATCH --mem=////GB
# Alokasi limit waktu menjalankan job.
# Format HH:MM:SS atau D-HH:MM:SS
  #SBATCH --time=////
# Definisi file untuk menampung output terminal
#SBATCH --output=result-%j.txt
# Definisi file untuk menampung output error log   
#SBATCH --error=error-%j.txt
# Memuat modul COMCOT CPU versi 1.7
module load comcot/1.7cpu
# -------------------------------------------------
# RUN SCRIPT
# -------------------------------------------------
# Perintah menjakankan COMCOT
comcot
|}
|-
|-
|'''3'''
!5
|Jalankan job dengan perintah sbatch.
$ '''sbatch''' '''''<nama-SLURM-Submit-script>'''''
Contoh menjalankan nama script <code>slurmcomcot.sh</code>.
$ sbatch slurmcomcot.sh
 
|-
|-
|'''4A'''
|User dapat melihat status jalannya job dengan perintah:
|User dapat melihat status jalannya job dengan perintah squeue dengan flag -ul $USER.
'''<code>$ squeue -ul $USER</code>'''


* Apabila tidak ada output artinya tidak ada job user yang berjalan / antri pada waktu itu.
$ '''squeue -ul $USER'''
Berikut adalah daftar STATE atau ST dari squeue yang menunjukkan status berjalannya job:
{| class="wikitable"
{| class="wikitable"
|+Daftar STATE squeue SLURM
! colspan="2" |''Kolom ST atau STATE menunjukkan status jalannya job.''
|-
!STATE
!STATE
!Kepanjangan
!Penjelasan
!Penjelasan
|-
|-
|R
|R (RUN)
|RUN
|Job berjalan
|Job berjalan
|-
|-
|PD
|PD (PENDING)
|PENDING
|Job tertahan, lihat [[Daftar Reason NODELIST ALELEON Supercomputer|'''NODELIST(REASON)''']]
|Job tertahan, lihat keterangan NODELIST(REASON)
|-
|-
|CG
|CG (COMPLETING)
|COMPLETING
|Job selesai dan dalam proses clean-up
|Job selesai dan dalam proses clean-up SLURM
|-
|-
|CA
|CA (CANCELED)
|CANCELED
|Job dibatalkan user
|Job dibatalkan oleh user
|-
|-
|PR
|PR (PREEMPETED)
|PREEMPETED
| Job dibatalkan admin, alasan dikabarkan via email
|Job dibatalkan oleh sys-admin Aleleon, alasan dikabarkan melalui email
|-
|-
|S
|S (SUSPENDED)
|SUSPENDED
|Job ditahan admin, alasan dikabarkan via email
|Job ditahan oleh sys-admin Aleleon
|}
|}
|-
|-
|'''4B'''
!
|Apabila user ingin membatalkan job, gunakan perintah scancel berdasarkan job ID.
|-
 
| Apabila user ingin menghentikan job yang berjalan, jalankan perintah:
* Job ID dapat dilihat melalui perintah squeue pada kolom JOBID.
  '''$ scancel ''[job-ID]'''''
* User hanya bisa membatalkan job submission milik user sendiri.
 
''Job ID ada pada squeue diatas.''
  $ '''scancel <''job-ID-submission-user''>'''
contoh membatalkan job ID 231:
Contoh user membatalkan job submission milik user dengan ID 231.
  $ scancel 231
  $ scancel 231
|}
|}
 
===Job Submission Web EFIRO===
=== GUI Web - EFIRO Job Composer ===
[[Berkas:Efirojobcomposer3.png|nirbing|500x500px]]
 
Menjalankan komputasi dengan tampilan grafis pada formulir job submission EFIRO Job Composer.
{| class="wikitable mw-collapsible mw-collapsed"
{| class="wikitable mw-collapsible mw-collapsed"
! colspan="2" |Langkah Menjalankan COMCOT via EFIRO Job Composer
!Langkah Job Submission Web EFIRO
[[Berkas:Efirojobcomposer3.png|nirbing|400x400px]]
|-
|-
|'''0'''
!1
|Sebelum login, [[Koneksi VPN ALELEON Supercomputer|'''user harus terhubung ke jaringan VPN ALELEON Supercomputer''']]. Apabila sudah terhubung:
|-
| Lakukan [https: / wiki.efisonlt.com wiki Menggunakan_ALELEON_Supercomputer_via_Terminal#1_ |'''[https://wiki.efisonlt.com/wiki/Menggunakan_ALELEON_Supercomputer_via_EFIRO#Login_Web_EFIRO Login ke web EFIRO]''' ALELEON Supercomputer.
|-
!2
|-
|[[Berkas:New Pinnedapps jc.png|nirbing|128x128px]]Buka pinned apps '''Job Composer''' di homepage EFIRO.
Pilih menu '''<code>New Job</code>''' -> '''<code>From Template</code>'''


* Buka alamat web '''<code><nowiki>http://aleleon.ood</nowiki></code>''' kemudian masukkan username dan password user.
[[Berkas:Jcnewjobmarked.png|nirbing|180x180px]]
** Bagi user Linux, buka alamat <code>'''<nowiki>http://10.192.50.11</nowiki>'''</code>
|-
|-
|'''1'''
!3
|Buka menu dashboard EFIRO '''<code>Jobs</code> > <code>Jobs Composer</code>'''
[[Berkas:Efirojobcomposermenu.png|nirbing|300x300px|al=]]
|-
|-
|'''2'''
|
|Pilih '''<code>New Jobs</code> > <code>From Template</code>'''
[[Berkas:Jcnewjobmarked.png|al=|nirbing|180x180px]]
|-
|'''3'''
|[[Berkas:Jcselecttemplate3.png|al=|nir|jmpl|Pilih template COMCOT yang dibutuhkan. Isi atau ganti <code>'''Job Name'''</code> sesuai keinginan user, kemudian klik <code>'''Create New Job'''</code>.|400x400px]]
{| class="wikitable"
{| class="wikitable"
! colspan="2" |Template COMCOT yang tersedia
! colspan="2" |'''Pilih template COMCOT yang diinginkan:'''
|-
|-
!Nama Template
!Nama Template
!Penjelasan
!Penjelasan
|-
|-
|COMCOT 1.7 (CPU)
|COMCOT 1.7
|Menjalankan COMCOT 1.7 versi CPU
|Menjalankan COMCOT versi 1.7
|}
|}Isi '''<code>Job Name</code>''' dan klik '''<code>Create New Job</code>'''
 
[[Berkas:Jctemplate-2.png|nirbing]]
|-
!4
|-
|Siapkan file komputasi yang dibutuhkan:
 
* Upload / download / edit file via menu <code>'''Edit Files'''</code>
** Untuk upload file tunggal diatas 2GB gunakan [[Upload File dengan Aplikasi FTP|'''software FTP''']].
 
[[Berkas:JC job menu.png|nirbing|500x500px]]
 
|-
|-
|'''4'''
!5A
|
[[Berkas:Jcjoboption3.png|nirbing|600x600px]]
*Gunakan menu '''<code>Edit Files</code>''' untuk upload file yang dibutuhkan'''.'''
**Laman Edit Files juga dapat melakukan view / download / edit / rename / delete file.
**''Fitur upload pada laman Edit Files '''mempunyai batasan ukuran upload 2GB per file'''. Gunakan [[Upload File dengan Aplikasi FTP|'''aplikasi FTP''']] apabila user hendak mengupload file tunggal diatas 2GB.''
|-
|-
|'''5'''
|Lengkapi '''Submit Script''' melalui tombol '''<code>Open Editor:</code>'''
|
*Submit script adalah 'formulir' untuk menjalankan job komputasi.
[[Berkas:Jceditor3.png|al=|nirbing|300x300px]]
**Ikuti petunjuk NOTES didalamnya.
*Klik '''<code>Save</code>''' setiap kali mengubah script.


Melalui '''<code>Open Editor</code>''', lengkapi Submit Script dengan mengganti bagian yang di tandai 4 garis miring (////).
[[Berkas:Jceditor3.png|al=|nirbing|400x400px]]
*''Jangan lupa klik <code>'''Save'''</code> setiap sekali mengubah script.''
{| class="wikitable"
! colspan="3" |Panduan singkat mengisi SBATCH''<sup>1</sup>''
|-
|-
!Parameter
|
!Nilai maks Fair policy usage''<sup>2</sup>''
*''<small>Info script lebih detail lihat [[Submit Script ALELEON Supercomputer|'''Submit Script ALELEON Supercomputer''']].</small>''
!Nilai maks untuk COMCOT
*''<small>Untuk SBATCH notifikasi email status jalannya job lihat [https://wiki.efisonlt.com/wiki/Submit_Script_ALELEON_Supercomputer#SBATCH_untuk_notifikasi_email_SLURM '''Slurm Jojo'''].</small>''
|-
|-
|ntasks
!5B
|128
|128
|-
|-
|mem
|SBATCH komputasi (ntasks, mem, time, dll) '''mempunyai limit''' berdasarkan:
|128GB
*Sisa Core Hour user dan [[Limitasi Fair Usage ALELEON Supercomputer|'''Fair Usage Limit''']].
|500GB''<sup>3</sup>''
*Spesifikasi sistem dan software komputasi.
Untuk melihat limit, jalankan perintah ini via menu '''<code>Open Terminal</code>''':
'''$ slimit-ser'''
|-
|-
|time
!6
| colspan="2" |3-00:00:00 atau 72:00:00
|}
'''Note:'''
# Info SBATCH lebih detail lihat laman [[Submit Script ALELEON Supercomputer|'''Submit Script ALELEON Supercomputer''']]
# Info limitasi fair policy usage lihat laman [[Limitasi Fair Usage ALELEON Supercomputer|'''Limitasi Fair Usage ALELEON Supercomputer''']]
# User dapat menggunakan memori RAM hingga 500GB pada node epyc001. Tambahkan parameter <code>'''#SBATCH --nodelist=epyc001'''</code>
|-
|-
|'''6A'''
|Jalankan job dengan klik tombol '''<code>Submit</code>'''.
|
*Pantau kolom status yang menjelaskan status jalannya job.
Jalankan job dengan klik tombol '''<code>Submit</code>'''.
*Apabila ingin membatalkan job yang berjalan, klik '''<code>Stop</code>'''.
 
[[Berkas:JC job runstop.png|al=|nirbing|500x500px]]
[[Berkas:Jcsubmit2.png|al=|nirbing|600x600px]]
 
Berikut penjelasan kolom '''<code>Status</code>,''' pantau dengan refresh halaman job''':'''
{| class="wikitable"
{| class="wikitable"
! colspan="2" |Daftar Status Job
|-
!Status
!Status
!Arti
!Arti
|-
|-
| Not Submitted
|Not Submitted
|Job belum pernah dijalankan.
|Job belum pernah dijalankan.
|-
|-
Baris 275: Baris 252:
|-
|-
|Failed
|Failed
|Job berhenti di tengah jalan,
|Job berhenti karena error atau di stop user.
Bisa karena di Stop atau Delete oleh user.
|-
| colspan="2" |'''''Untuk melihat alasan job yang queue:'''''[[Berkas:Active Jobs detail.png|nir|jmpl|300x300px|''Buka pinned apps '''Active Jobs''' di homepage EFIRO. Ubah opsi All jobs ke '''Your Jobs'''. Klik simbol '''>''' untuk melihat status job yang pending pada kolom Reason. Arti reason lihat laman [[Daftar Reason NODELIST ALELEON Supercomputer|'''Daftar Reason NODELIST ALELEON Supercomputer''']].'']]
|}
|}
|-
|-
|'''6B'''
!7
|
|-
Untuk menghentikan job yang tengah berjalan, klik tombol '''Stop'''.
|Lihat output file komputasi pada kolom '''<code>Folder Contents</code>'''
 
*Atau dengan membuka menu '''<code>Edit Files</code>'''
[[Berkas:Stop.png|nirbing|600x600px]]
[[Berkas:Jcfoldercontentsedit.png|al=|nir|jmpl|''Kolom '''<code>Folder Contents</code>'''.'']]
|-
|-
|'''7A'''
!8
|
Hasil output job dapat dilihat pada kolom '''<code>Folder Contents</code>''' atau membuka halaman '''<code>Edit Pages</code>.'''[[Berkas:Jcfoldercontentsedit.png|al=|nir|jmpl|User dapat melihat semua file output yang keluar di kolom '''<code>Folder Contents</code>'''.]][[Berkas:Jcjoboption3.png|nir|jmpl|atau dengan membuka menu '''<code>Edit Files</code>'''.]]
|-
|-
|'''7B'''
|Untuk menghapus ruang job dan datanya:
|
 
User dapat '''menjalankan ulang ruang job yang sama''' (misalkan ketika ada koreksi file input atau Submit Script) dengan '''mengklik kembali tombol <code>Submit</code>'''.
* Pilih ruang job yang akan dihapus.
* Klik menu '''<code>Delete</code>'''
 
[[Berkas:JC delete menu.png|nirbing|500x500px]]
|}
|}
== '''Pelaporan Kendala dan Support''' ==
Apabila menjumpai masalah teknis dalam menjalankan komputasi, silahkan lapor dengan klik gambar berikut ini.


== '''Notifikasi Status Jalannya Job Submission via email''' ==
[[Berkas:Wiki-pelaporankendala.jpg|1000x1000px|link=https://efisonlt.com/aleleonbugreport]]
SLURM ALELEON Supercomputer dapat mengirim notifikasi email kepada user '''untuk mengabarkan apabila job user sudah berjalan atau selesai'''. SLURM ALELEON Supercomputer menggunakan nama email '''Jojo''' untuk mengirim notifikasi email.


Silahkan tambahan SBATCH berikut pada SLURM Submit Script (dapat ditambahkan setelah SBATCH error) apabila user ingin menerima notifikasi email dari SLURM:
---
#SBATCH --mail-user='''<''alamat-email-user''>'''
#SBATCH --mail-type=begin
#SBATCH --mail-type=end


* '''mail-user'''
Bila terdapat pertanyaan lainnya, silahkan hubungi admin EFISON melalui email:
** Alamat email user untuk menerima notifikasi SLURM
'''support@efisonlt.com'''
* '''mail-type=begin'''
** Notifikasi email yang menginfokan job sudah berjalan.
* '''mail-type=end'''
** Notifikasi email yang menginfokan job sudah selesai.
** Sekaligus memberikan cuplikan 20 baris terakhir dari file output SBATCH output dan error job user.

Revisi terkini sejak 22 Juli 2024 08.46

COMCOT (Cornell Multi-grid Coupled Tsunami Grid) adalah software pemodelan tsunami yang menggunakan metode Shallow Water Equations.

Modul COMCOT

Berikut adalah detail versi COMCOT yang tersedia secara global di ALELEON Supercomputer:

Versi Nama modul Dukungan hardware
CPU GPU OMP

Threading

MPI

multi-node

1.7 comcot/1.7cpu V - - -

Hubungi tim admin melalui email support@efisonlt.com untuk permintaan instalasi versi lain.

Pilihan Menjalankan Komputasi

User dapat memilih metode menjalankan komputasi sesuai keinginan: (klik expand / kembangkan)

  • Job submission terminal
  • Job submission web EFIRO
    • Berjalan di compute node melalui manajemen Slurm via web EFIRO.

Job Submission Terminal

Langkah Job Submission Terminal

Sbatch Terminal.png

1
Login SSH ke ALELEON Supercomputer.
2
Siapkan file komputasi yang dibutuhkan.
3A
Buat Submit Script yaitu 'formulir' untuk menjalankan job komputasi.
  • Nama file bebas dengan format .sh, contoh submit.sh
Contoh template Submit Script, ikuti petunjuk NOTES didalamnya.
  • Klik expand / kembangkan
Template Submit Script COMCOT
#!/bin/bash

# -----------------------------------------------------
# Template SLURM Submit Script
# COMCOT | rev.080124
# 
# NOTES: 
# 1. Isi bagian yang ditandai 4 garing (////).
# 2. Template ini bersifat referensi.
#    User dapat mengubah bagian yang perlu diubah.
# -----------------------------------------------------

# -----------------------------------------------------
# Alokasi komputasi SBATCH, input, dan module
# -----------------------------------------------------

# Alokasi jumlah core thread CPU
#SBATCH --ntasks=////

# Alokasi jumlah memori RAM (satuan GB)
#SBATCH --mem=////GB

# Alokasi limit waktu menjalankan job
# Format HH:MM:SS atau D-HH:MM:SS
#SBATCH --time=////

# Definisi file untuk menampung output terminal program
#SBATCH --output=result-%j.txt

# Definisi file untuk menampung output error log    
#SBATCH --error=error-%j.txt 

# Memuat modul software COMCOT
# Daftar modul lihat subbab "Modul COMCOT" di atas 
module load comcot////

# ----------------------------------------------------
# Script jalannya program
# ----------------------------------------------------

# Perintah menjakankan COMCOT
comcot
  • Untuk SBATCH notifikasi email status jalannya job lihat Slurm Jojo.
3B
SBATCH komputasi (ntasks, mem, time, dll) mempunyai limit berdasarkan:
  • Sisa Core Hour user dan Fair Usage Limit.
  • Spesifikasi sistem dan software komputasi.

Untuk melihat limit, jalankan perintah berikut:

$ slimit-ser
4
Jalankan job komputasi dengan perintah:
$ sbatch [nama-submit-script]

Contoh:
$ sbatch submit.sh
5
User dapat melihat status jalannya job dengan perintah:

$ squeue -ul $USER

Kolom ST atau STATE menunjukkan status jalannya job.
STATE Penjelasan
R (RUN) Job berjalan
PD (PENDING) Job tertahan, lihat NODELIST(REASON)
CG (COMPLETING) Job selesai dan dalam proses clean-up
CA (CANCELED) Job dibatalkan user
PR (PREEMPETED) Job dibatalkan admin, alasan dikabarkan via email
S (SUSPENDED) Job ditahan admin, alasan dikabarkan via email
Apabila user ingin menghentikan job yang berjalan, jalankan perintah:
$ scancel [job-ID]

Job ID ada pada squeue diatas.
contoh membatalkan job ID 231:
$ scancel 231

Job Submission Web EFIRO

Langkah Job Submission Web EFIRO

Efirojobcomposer3.png

1
Login ke web EFIRO ALELEON Supercomputer.
2
New Pinnedapps jc.pngBuka pinned apps Job Composer di homepage EFIRO.

Pilih menu New Job -> From Template

Jcnewjobmarked.png

3
Pilih template COMCOT yang diinginkan:
Nama Template Penjelasan
COMCOT 1.7 Menjalankan COMCOT versi 1.7
Isi Job Name dan klik Create New Job

Jctemplate-2.png

4
Siapkan file komputasi yang dibutuhkan:
  • Upload / download / edit file via menu Edit Files

JC job menu.png

5A
Lengkapi Submit Script melalui tombol Open Editor:
  • Submit script adalah 'formulir' untuk menjalankan job komputasi.
    • Ikuti petunjuk NOTES didalamnya.
  • Klik Save setiap kali mengubah script.

5B
SBATCH komputasi (ntasks, mem, time, dll) mempunyai limit berdasarkan:
  • Sisa Core Hour user dan Fair Usage Limit.
  • Spesifikasi sistem dan software komputasi.

Untuk melihat limit, jalankan perintah ini via menu Open Terminal:

$ slimit-ser
6
Jalankan job dengan klik tombol Submit.
  • Pantau kolom status yang menjelaskan status jalannya job.
  • Apabila ingin membatalkan job yang berjalan, klik Stop.

Daftar Status Job
Status Arti
Not Submitted Job belum pernah dijalankan.
Running Job berjalan.
Queue Job mengantri dan belum berjalan.
Completed Job selesai berjalan.
Failed Job berhenti karena error atau di stop user.
Untuk melihat alasan job yang queue:
Buka pinned apps Active Jobs di homepage EFIRO. Ubah opsi All jobs ke Your Jobs. Klik simbol > untuk melihat status job yang pending pada kolom Reason. Arti reason lihat laman Daftar Reason NODELIST ALELEON Supercomputer.
7
Lihat output file komputasi pada kolom Folder Contents
  • Atau dengan membuka menu Edit Files
Kolom Folder Contents.
8
Untuk menghapus ruang job dan datanya:
  • Pilih ruang job yang akan dihapus.
  • Klik menu Delete

JC delete menu.png

Pelaporan Kendala dan Support

Apabila menjumpai masalah teknis dalam menjalankan komputasi, silahkan lapor dengan klik gambar berikut ini.

Wiki-pelaporankendala.jpg

---

Bila terdapat pertanyaan lainnya, silahkan hubungi admin EFISON melalui email:

support@efisonlt.com