COMCOT: Perbedaan antara revisi

Dari ALELEON by EFISON
(menambah link nodelist reason)
Baris 32: Baris 32:
[[Berkas:Sbatch Terminal.png|nirbing|500x500px]]
[[Berkas:Sbatch Terminal.png|nirbing|500x500px]]


Menjalankan komputasi pada terminal melalui job submission SLURM sbatch. Tutorial ini mengasumsikan user dapat menggunakan terminal Linux.  
Menjalankan komputasi pada terminal melalui job submission SLURM sbatch.  
{| class="wikitable mw-collapsible mw-collapsed"
{| class="wikitable mw-collapsible mw-collapsed"
! colspan="2" |Langkah Menjalankan COMCOT via SLURM sbatch
! colspan="2" |Langkah Menjalankan COMCOT via SLURM sbatch
|-
|-
|'''0'''
| rowspan="2" |'''0'''
|Sebelum login, [[Koneksi VPN ALELEON Supercomputer|'''user harus terhubung ke jaringan VPN ALELEON Supercomputer''']]. Apabila sudah terhubung, login dengan SSH:
|Sebelum login, [[Koneksi VPN ALELEON Supercomputer|'''user harus terhubung ke jaringan VPN ALELEON Supercomputer''']].  
 
|-
|Login dengan SSH:
* User OS Windows dan MacOS -> <code>'''$ ssh <''username''>@aleleon.hpc'''</code>
* User OS Windows dan MacOS -> <code>'''$ ssh <''username''>@aleleon.hpc'''</code>
* User OS Linux -> <code>'''$ ssh <''username''>@10.192.50.10'''</code>
* User OS Linux -> <code>'''$ ssh <''username''>@10.192.50.10'''</code>
Baris 45: Baris 46:
|Siapkan file yang dibutuhkan untuk menjalankan komputasi user.
|Siapkan file yang dibutuhkan untuk menjalankan komputasi user.


* [[Upload File dengan Aplikasi FTP|'''User dapat melakukan upload / download file dengan bantuan aplikasi FTP''']] seperti FileZilla, WinSCP, dan lainnya.
* [[Upload File dengan Aplikasi FTP|'''User dapat melakukan upload / download file dengan bantuan aplikasi FTP''']]
* Untuk kerapian data, disarankan untuk menaruh satu job pada satu folder tersendiri.
* Untuk kerapian data, disarankan untuk menaruh setiap job pada folder tersendiri.
|-
|-
|'''2'''
|'''2'''
|Buat '''SLURM Submit Script''' yaitu semacam formulir untuk menjalankan job dengan panduan berikut:  
|Buat '''SLURM Submit Script''' yaitu 'formulir' untuk menjalankan job dengan panduan berikut:  


* Nama script dibebaskan, contoh <code>slurmcomcot.sh</code>
* Nama script dibebaskan, contoh <code>slurmcomcot.sh</code>
* Ikuti panduan template berikut dan petunjuk pada NOTES didalamnya.
* Ikuti panduan template berikut dan petunjuk pada NOTES di dalamnya.
{| class="wikitable"
{| class="wikitable"
! colspan="3" |Panduan singkat mengisi SBATCH''<sup>1</sup>''
! colspan="3" |Panduan singkat mengisi SBATCH''<sup>1</sup>''
Baris 74: Baris 75:
# Info semua SBATCH lebih detail lihat laman [[Submit Script ALELEON Supercomputer|'''Submit Script ALELEON Supercomputer''']]
# Info semua SBATCH lebih detail lihat laman [[Submit Script ALELEON Supercomputer|'''Submit Script ALELEON Supercomputer''']]
# Info limitasi fair policy usage lihat laman [[Limitasi Fair Usage ALELEON Supercomputer|'''Limitasi Fair Usage ALELEON Supercomputer''']]
# Info limitasi fair policy usage lihat laman [[Limitasi Fair Usage ALELEON Supercomputer|'''Limitasi Fair Usage ALELEON Supercomputer''']]
# User dapat menggunakan memori RAM hingga 500GB pada node epyc001. Tambahkan parameter <code>'''#SBATCH --nodelist=epyc001'''</code>
# User dapat menggunakan memori RAM hingga 500GB pada node epyc001.  
#* Tambahkan parameter <code>'''#SBATCH --nodelist=epyc001'''</code>
{| class="wikitable"
{| class="wikitable"
!Template SLURM Submit Script COMCOT
!Template SLURM Submit Script COMCOT
Baris 89: Baris 91:
  # | NOTES:  
  # | NOTES:  
  # | 1. Isi bagian yang ditandai 4 garing (////).
  # | 1. Isi bagian yang ditandai 4 garing (////).
  # | 2. Template ini adalah referensi.
  # | 2. Template ini bersifat referensi.
  # |    User dapat mengubah bagian yang sekiranya perlu diubah.
  # |    User dapat mengubah bagian yang sekiranya perlu diubah.
  # | 3. Panduan menjalankan COMCOT di ALELEON lihat:  
  # | 3. Panduan menjalankan COMCOT di ALELEON lihat:  
Baris 134: Baris 136:
|-
|-
|'''4A'''
|'''4A'''
|User dapat melihat status jalannya job dengan perintah squeue dengan flag -ul $USER.  
|User dapat melihat status jalannya job dengan perintah squeue berikut.  


* Apabila tidak ada output artinya tidak ada job user yang berjalan / antri pada waktu itu.
* Apabila tidak ada output artinya tidak ada job user yang berjalan / antri pada waktu itu.


  $ '''squeue -ul $USER'''
  $ '''squeue -ul $USER'''
Berikut adalah daftar STATE atau ST dari squeue yang menunjukkan status berjalannya job:  
Berikut adalah daftar STATE (ST) dari squeue yang menunjukkan status berjalannya job:  
{| class="wikitable"
{| class="wikitable"
|+Daftar STATE squeue SLURM
|+Daftar STATE squeue SLURM
Baris 189: Baris 191:
! colspan="2" |Langkah Menjalankan COMCOT via EFIRO Job Composer
! colspan="2" |Langkah Menjalankan COMCOT via EFIRO Job Composer
|-
|-
|'''0'''
| rowspan="2" |'''0'''
|Sebelum login, [[Koneksi VPN ALELEON Supercomputer|'''user harus terhubung ke jaringan VPN ALELEON Supercomputer''']]. Apabila sudah terhubung:
|Sebelum login, [[Koneksi VPN ALELEON Supercomputer|'''user harus terhubung ke jaringan VPN ALELEON Supercomputer''']].  
 
|-
* Buka alamat web '''<code><nowiki>http://aleleon.ood</nowiki></code>''' kemudian masukkan username dan password user.
|Buka alamat web '''<code><nowiki>http://aleleon.ood</nowiki></code>''' kemudian masukkan username dan password user.
** Bagi user Linux, buka alamat <code>'''<nowiki>http://10.192.50.11</nowiki>'''</code>
* Bagi user Linux, buka alamat <code>'''<nowiki>http://10.192.50.11</nowiki>'''</code>
|-
|-
|'''1'''
|'''1'''
Baris 218: Baris 220:
|
|
[[Berkas:Jcjoboption3.png|nirbing|600x600px]]
[[Berkas:Jcjoboption3.png|nirbing|600x600px]]
*Gunakan menu '''<code>Edit Files</code>''' untuk upload file yang dibutuhkan'''.'''
 
**Laman Edit Files juga dapat melakukan view / download / edit / rename / delete file.
Gunakan menu '''<code>Edit Files</code>''' untuk upload file yang dibutuhkan'''.'''
**''Fitur upload pada laman Edit Files '''mempunyai batasan ukuran upload 2GB per file'''. Gunakan [[Upload File dengan Aplikasi FTP|'''aplikasi FTP''']] apabila user hendak mengupload file tunggal diatas 2GB.''
*Laman Edit Files juga dapat melakukan view / download / edit / rename / delete file.
*''Fitur upload pada laman Edit Files '''mempunyai batasan ukuran upload 2GB per file'''.''
**''Gunakan [[Upload File dengan Aplikasi FTP|'''aplikasi FTP''']] apabila user hendak mengupload file tunggal diatas 2GB.''
|-
|-
|'''5'''
|'''5'''
Baris 228: Baris 232:
Melalui '''<code>Open Editor</code>''', lengkapi Submit Script dengan mengganti bagian yang di tandai 4 garis miring (////).
Melalui '''<code>Open Editor</code>''', lengkapi Submit Script dengan mengganti bagian yang di tandai 4 garis miring (////).
*''Jangan lupa klik <code>'''Save'''</code> setiap sekali mengubah script.''
*''Jangan lupa klik <code>'''Save'''</code> setiap sekali mengubah script.''
*Template ini bersifat referensi, user dapat mengubah bagian yang sekiranya perlu diubah.
{| class="wikitable"
{| class="wikitable"
! colspan="3" |Panduan singkat mengisi SBATCH''<sup>1</sup>''
! colspan="3" |Panduan singkat mengisi SBATCH''<sup>1</sup>''
Baris 249: Baris 254:
# Info SBATCH lebih detail lihat laman [[Submit Script ALELEON Supercomputer|'''Submit Script ALELEON Supercomputer''']]
# Info SBATCH lebih detail lihat laman [[Submit Script ALELEON Supercomputer|'''Submit Script ALELEON Supercomputer''']]
# Info limitasi fair policy usage lihat laman [[Limitasi Fair Usage ALELEON Supercomputer|'''Limitasi Fair Usage ALELEON Supercomputer''']]
# Info limitasi fair policy usage lihat laman [[Limitasi Fair Usage ALELEON Supercomputer|'''Limitasi Fair Usage ALELEON Supercomputer''']]
# User dapat menggunakan memori RAM hingga 500GB pada node epyc001. Tambahkan parameter <code>'''#SBATCH --nodelist=epyc001'''</code>
# User dapat menggunakan memori RAM hingga 500GB pada node epyc001.  
#* Tambahkan parameter <code>'''#SBATCH --nodelist=epyc001'''</code>
|-
|-
|'''6A'''
|'''6A'''
Baris 275: Baris 281:
|-
|-
|Failed
|Failed
|Job berhenti di tengah jalan,
|Job berhenti di tengah jalan, bisa karena di Stop atau Delete oleh user.
Bisa karena di Stop atau Delete oleh user.
|}
|}
|-
|-
Baris 291: Baris 296:
|'''7B'''
|'''7B'''
|
|
User dapat '''menjalankan ulang ruang job yang sama''' (misalkan ketika ada koreksi file input atau Submit Script) dengan '''mengklik kembali tombol <code>Submit</code>'''.
User dapat '''menjalankan ulang ruang job yang sama''' dengan '''mengklik kembali tombol <code>Submit</code>'''.
|}
|}



Revisi per 9 Oktober 2023 05.15

COMCOT (Cornell Multi-grid Coupled Tsunami Grid) adalah software pemodelan tsunami yang menggunakan metode Shallow Water Equations.

Modul COMCOT

Berikut adalah detail versi COMCOT yang tersedia secara global di ALELEON Supercomputer:

Versi Nama modul Modul

DEFAULT

Dukungan hardware
CPU GPU OMP

Threading

MPI

multi-node

1.7 comcot/1.7cpu V V - - -

Menjalankan COMCOT

User dapat menjalankan COMCOT dengan pilihan cara menjalankan komputasi via terminal atau EFIRO:

Terminal - SLURM sbatch

Sbatch Terminal.png

Menjalankan komputasi pada terminal melalui job submission SLURM sbatch.

Langkah Menjalankan COMCOT via SLURM sbatch
0 Sebelum login, user harus terhubung ke jaringan VPN ALELEON Supercomputer.
Login dengan SSH:
  • User OS Windows dan MacOS -> $ ssh <username>@aleleon.hpc
  • User OS Linux -> $ ssh <username>@10.192.50.10
1 Siapkan file yang dibutuhkan untuk menjalankan komputasi user.
2 Buat SLURM Submit Script yaitu 'formulir' untuk menjalankan job dengan panduan berikut:
  • Nama script dibebaskan, contoh slurmcomcot.sh
  • Ikuti panduan template berikut dan petunjuk pada NOTES di dalamnya.
Panduan singkat mengisi SBATCH1
Parameter Nilai maks Fair policy usage2 Nilai maks untuk COMCOT
ntasks 128 128
mem 128GB 500GB3
time 3-00:00:00 atau 72:00:00

Note:

  1. Info semua SBATCH lebih detail lihat laman Submit Script ALELEON Supercomputer
  2. Info limitasi fair policy usage lihat laman Limitasi Fair Usage ALELEON Supercomputer
  3. User dapat menggunakan memori RAM hingga 500GB pada node epyc001.
    • Tambahkan parameter #SBATCH --nodelist=epyc001
Template SLURM Submit Script COMCOT
#!/bin/bash

# -------------------------------------------------------------
# | Template SLURM Submit Script
# | Software        : COMCOT (CPU)
# | Versi           : 1.7
# | Update script  r: 06/10/2023
# |
# | NOTES: 
# | 1. Isi bagian yang ditandai 4 garing (////).
# | 2. Template ini bersifat referensi.
# |    User dapat mengubah bagian yang sekiranya perlu diubah.
# | 3. Panduan menjalankan COMCOT di ALELEON lihat: 
# |    https://wiki.efisonlt.com/wiki/COMCOT
# -------------------------------------------------------------

# --------------------------------------------------
# Alokasi komputasi, modul software, dan file input
# --------------------------------------------------

# Alokasi jumlah core thread CPU
#SBATCH --ntasks=////

# Alokasi jumlah memori RAM (satuan GB)
#SBATCH --mem=////GB

# Alokasi limit waktu menjalankan job. 
# Format HH:MM:SS atau D-HH:MM:SS
#SBATCH --time=////

# Definisi file untuk menampung output terminal
#SBATCH --output=result-%j.txt

# Definisi file untuk menampung output error log    
#SBATCH --error=error-%j.txt 

# Memuat modul COMCOT CPU versi 1.7
module load comcot/1.7cpu

# -------------------------------------------------
# RUN SCRIPT
# -------------------------------------------------

# Perintah menjakankan COMCOT
comcot
3 Jalankan job dengan perintah sbatch.
$ sbatch <nama-SLURM-Submit-script>

Contoh menjalankan nama script slurmcomcot.sh.

$ sbatch slurmcomcot.sh
4A User dapat melihat status jalannya job dengan perintah squeue berikut.
  • Apabila tidak ada output artinya tidak ada job user yang berjalan / antri pada waktu itu.
$ squeue -ul $USER

Berikut adalah daftar STATE (ST) dari squeue yang menunjukkan status berjalannya job:

Daftar STATE squeue SLURM
STATE Kepanjangan Penjelasan
R RUN Job berjalan
PD PENDING Job tertahan, lihat keterangan NODELIST(REASON)
CG COMPLETING Job selesai dan dalam proses clean-up SLURM
CA CANCELED Job dibatalkan oleh user
PR PREEMPETED Job dibatalkan oleh sys-admin Aleleon, alasan dikabarkan melalui email
S SUSPENDED Job ditahan oleh sys-admin Aleleon
4B Apabila user ingin membatalkan job, gunakan perintah scancel berdasarkan job ID.
  • Job ID dapat dilihat melalui perintah squeue pada kolom JOBID.
  • User hanya bisa membatalkan job submission milik user sendiri.
$ scancel <job-ID-submission-user>

Contoh user membatalkan job submission milik user dengan ID 231.

$ scancel 231

GUI Web - EFIRO Job Composer

Efirojobcomposer3.png

Menjalankan komputasi dengan tampilan grafis pada formulir job submission EFIRO Job Composer.

Langkah Menjalankan COMCOT via EFIRO Job Composer
0 Sebelum login, user harus terhubung ke jaringan VPN ALELEON Supercomputer.
Buka alamat web http://aleleon.ood kemudian masukkan username dan password user.
  • Bagi user Linux, buka alamat http://10.192.50.11
1 Buka menu dashboard EFIRO Jobs > Jobs Composer

2 Pilih New Jobs > From Template

3
Pilih template COMCOT yang dibutuhkan. Isi atau ganti Job Name sesuai keinginan user, kemudian klik Create New Job.
Template COMCOT yang tersedia
Nama Template Penjelasan
COMCOT 1.7 (CPU) Menjalankan COMCOT 1.7 versi CPU
4

Jcjoboption3.png

Gunakan menu Edit Files untuk upload file yang dibutuhkan.

  • Laman Edit Files juga dapat melakukan view / download / edit / rename / delete file.
  • Fitur upload pada laman Edit Files mempunyai batasan ukuran upload 2GB per file.
    • Gunakan aplikasi FTP apabila user hendak mengupload file tunggal diatas 2GB.
5

Melalui Open Editor, lengkapi Submit Script dengan mengganti bagian yang di tandai 4 garis miring (////).

  • Jangan lupa klik Save setiap sekali mengubah script.
  • Template ini bersifat referensi, user dapat mengubah bagian yang sekiranya perlu diubah.
Panduan singkat mengisi SBATCH1
Parameter Nilai maks Fair policy usage2 Nilai maks untuk COMCOT
ntasks 128 128
mem 128GB 500GB3
time 3-00:00:00 atau 72:00:00

Note:

  1. Info SBATCH lebih detail lihat laman Submit Script ALELEON Supercomputer
  2. Info limitasi fair policy usage lihat laman Limitasi Fair Usage ALELEON Supercomputer
  3. User dapat menggunakan memori RAM hingga 500GB pada node epyc001.
    • Tambahkan parameter #SBATCH --nodelist=epyc001
6A

Jalankan job dengan klik tombol Submit.

Berikut penjelasan kolom Status, pantau dengan refresh halaman job:

Status Arti
Not Submitted Job belum pernah dijalankan.
Running Job berjalan.
Queue Job mengantri dan belum berjalan.
Completed Job selesai berjalan.
Failed Job berhenti di tengah jalan, bisa karena di Stop atau Delete oleh user.
6B

Untuk menghentikan job yang tengah berjalan, klik tombol Stop.

Stop.png

7A Hasil output job dapat dilihat pada kolom Folder Contents atau membuka halaman Edit Pages.
User dapat melihat semua file output yang keluar di kolom Folder Contents.
atau dengan membuka menu Edit Files.
7B

User dapat menjalankan ulang ruang job yang sama dengan mengklik kembali tombol Submit.

Notifikasi Status Jalannya Job Submission via email

SLURM ALELEON Supercomputer dapat mengirim notifikasi email kepada user untuk mengabarkan apabila job user sudah berjalan atau selesai. SLURM ALELEON Supercomputer menggunakan nama email Jojo untuk mengirim notifikasi email.

Silahkan tambahan SBATCH berikut pada SLURM Submit Script (dapat ditambahkan setelah SBATCH error) apabila user ingin menerima notifikasi email dari SLURM:

#SBATCH --mail-user=<alamat-email-user>
#SBATCH --mail-type=begin
#SBATCH --mail-type=end
  • mail-user
    • Alamat email user untuk menerima notifikasi SLURM
  • mail-type=begin
    • Notifikasi email yang menginfokan job sudah berjalan.
  • mail-type=end
    • Notifikasi email yang menginfokan job sudah selesai.
    • Sekaligus memberikan cuplikan 20 baris terakhir dari file output SBATCH output dan error job user.