COMCOT: Perbedaan antara revisi
WilsonLisan (bicara | kontrib) (test format) |
WilsonLisan (bicara | kontrib) (tes format) |
||
Baris 30: | Baris 30: | ||
=== Terminal - SLURM sbatch === | === Terminal - SLURM sbatch === | ||
Menjalankan komputasi pada terminal melalui job submission SLURM sbatch. | Menjalankan komputasi pada terminal melalui job submission SLURM sbatch. Tutorial ini mengasumsikan user dapat menggunakan terminal Linux. | ||
{| class="wikitable" | {| class="wikitable mw-collapsible mw-collapsed" | ||
! colspan="2" |Langkah Menjalankan COMCOT via SLURM sbatch | ! colspan="2" |Langkah Menjalankan COMCOT via SLURM sbatch | ||
|- | |- | ||
|'''0''' | |'''0''' | ||
| | |Sebelum login, [[Koneksi VPN ALELEON Supercomputer|'''user harus terhubung ke jaringan VPN ALELEON Supercomputer''']]. Apabila sudah terhubung, user login dengan SSH: | ||
* User OS Windows dan MacOS -> <code>'''$ ssh <''username''>@aleleon.hpc'''</code> | * User OS Windows dan MacOS -> <code>'''$ ssh <''username''>@aleleon.hpc'''</code> | ||
Baris 47: | Baris 47: | ||
|- | |- | ||
|'''2''' | |'''2''' | ||
|Buat SLURM Submit Script dengan panduan berikut: | |Buat '''SLURM Submit Script''' yaitu semacam formulir untuk menjalankan job dengan panduan berikut: | ||
* Nama script dibebaskan, contoh <code>'''slurmcomcot.sh'''</code> | * Nama script dibebaskan, contoh <code>'''slurmcomcot.sh'''</code> | ||
* Ikuti petunjuk | * Ikuti petunjuk pada NOTES. | ||
{| class="wikitable" | |||
|+Panduan singkat mengisi SBATCH. Info detail lihat laman [[Submit Script ALELEON Supercomputer]] | |||
!Parameter | |||
!Nilai maksimal fair policy usage<sup>''1''</sup> | |||
!Nilai maksimal untuk COMCOT | |||
|- | |||
|ntasks | |||
|128 | |||
|128 | |||
|- | |||
|mem | |||
|128GB | |||
|500GB<sup>''2''</sup> | |||
|- | |||
|time | |||
| colspan="2" |3-00:00:00 atau 72:00:00 | |||
|- | |||
| colspan="3" |Note: | |||
# Info limitasi fair policy usage lihat laman [[Limitasi Fair Usage ALELEON Supercomputer|'''Limitasi Fair Usage ALELEON Supercomputer''']] | |||
# User dapat menggunakan memori RAM hingga 500GB pada node epyc001. Tambahkan parameter <code>'''#SBATCH --nodelist=epyc001'''</code> | |||
|} | |||
#!/bin/bash | #!/bin/bash | ||
Baris 97: | Baris 118: | ||
# Perintah menjakankan COMCOT | # Perintah menjakankan COMCOT | ||
comcot | comcot | ||
|- | |- | ||
|'''3''' | |'''3''' | ||
|Jalankan job dengan perintah sbatch. | |Jalankan job dengan perintah sbatch. | ||
$ '''sbatch''' '''''<nama-SLURM-script>''''' | $ '''sbatch''' '''''<nama-SLURM-Submit-script>''''' | ||
Contoh menjalankan nama script slurmcomcot.sh. | Contoh menjalankan nama script <code>slurmcomcot.sh</code>. | ||
$ sbatch slurmcomcot.sh | $ sbatch slurmcomcot.sh | ||
|- | |- | ||
|'''4A''' | |'''4A''' | ||
|User dapat melihat status jalannya job dengan perintah squeue | |User dapat melihat status jalannya job dengan perintah squeue dengan flag -ul $USER. | ||
* Apabila tidak ada output artinya tidak ada job user yang berjalan / antri pada waktu itu. | * Apabila tidak ada output artinya tidak ada job user yang berjalan / antri pada waktu itu. | ||
$ '''squeue -ul $USER''' | $ '''squeue -ul $USER''' | ||
Berikut adalah daftar STATE atau ST dari squeue yang menunjukkan status berjalannya job: | |||
{| class="wikitable" | |||
|+Daftar STATE squeue SLURM | |||
!STATE | |||
!Kepanjangan | |||
!Penjelasan | |||
|- | |||
|R | |||
|RUN | |||
|Job berjalan | |||
|- | |||
|PD | |||
|PENDING | |||
|Job tertahan, lihat keterangan NODELIST(REASON) | |||
|- | |||
|CG | |||
|COMPLETING | |||
|Job selesai dan dalam proses clean-up SLURM | |||
|- | |||
|CA | |||
|CANCELED | |||
|Job dibatalkan oleh user | |||
|- | |||
|PR | |||
|PREEMPETED | |||
|Job dibatalkan oleh sys-admin Aleleon, alasan dikabarkan melalui email | |||
|- | |||
|S | |||
|SUSPENDED | |||
|Job ditahan oleh sys-admin Aleleon | |||
|} | |||
|- | |- | ||
|'''4B''' | |'''4B''' | ||
|Apabila user ingin membatalkan job, gunakan perintah scancel berdasarkan job ID. | |Apabila user ingin membatalkan job, gunakan perintah scancel berdasarkan job ID. | ||
* Job ID dapat dilihat melalui perintah squeue pada kolom JOBID. | |||
* User hanya bisa membatalkan job submission milik user sendiri. | * User hanya bisa membatalkan job submission milik user sendiri. | ||
Baris 146: | Baris 177: | ||
=== GUI Web - EFIRO Job Composer === | === GUI Web - EFIRO Job Composer === | ||
Menjalankan komputasi dengan tampilan grafis pada formulir job submission EFIRO Job Composer. | Menjalankan komputasi dengan tampilan grafis pada formulir job submission EFIRO Job Composer. | ||
{| class="wikitable" | {| class="wikitable mw-collapsible mw-collapsed" | ||
! colspan="2" |Langkah Menjalankan COMCOT via EFIRO Job Composer | ! colspan="2" |Langkah Menjalankan COMCOT via EFIRO Job Composer | ||
|- | |- | ||
|'''0''' | |'''0''' | ||
|Sebelum login, [[Koneksi VPN ALELEON Supercomputer|'''user harus terhubung ke jaringan VPN ALELEON Supercomputer''']]. Apabila sudah terhubung | |Sebelum login, [[Koneksi VPN ALELEON Supercomputer|'''user harus terhubung ke jaringan VPN ALELEON Supercomputer''']]. Apabila sudah terhubung: | ||
* Buka alamat web '''<code><nowiki>http://aleleon.ood</nowiki></code>''' kemudian masukkan username dan password user. | * Buka alamat web '''<code><nowiki>http://aleleon.ood</nowiki></code>''' kemudian masukkan username dan password user. | ||
Baris 181: | Baris 212: | ||
**''Fitur upload pada laman Edit Files '''mempunyai batasan ukuran upload 2GB per file'''. Gunakan [[Upload File dengan Aplikasi FTP|'''aplikasi FTP''']] apabila user hendak mengupload file tunggal diatas 2GB.'' | **''Fitur upload pada laman Edit Files '''mempunyai batasan ukuran upload 2GB per file'''. Gunakan [[Upload File dengan Aplikasi FTP|'''aplikasi FTP''']] apabila user hendak mengupload file tunggal diatas 2GB.'' | ||
|- | |- | ||
|''' | |'''5''' | ||
| | | | ||
[[Berkas:Jceditor3.png|al=|nirbing|300x300px]] | [[Berkas:Jceditor3.png|al=|nirbing|300x300px]] | ||
Baris 190: | Baris 221: | ||
|+Panduan singkat mengisi SBATCH. Info detail lihat laman [[Submit Script ALELEON Supercomputer]] | |+Panduan singkat mengisi SBATCH. Info detail lihat laman [[Submit Script ALELEON Supercomputer]] | ||
!Parameter | !Parameter | ||
!Nilai maksimal | !Nilai maksimal fair policy usage<sup>''1''</sup> | ||
!Nilai maksimal untuk COMCOT | !Nilai maksimal untuk COMCOT | ||
|- | |- | ||
Baris 210: | Baris 241: | ||
|} | |} | ||
|- | |- | ||
|'''6A''' | |||
| | | | ||
Jalankan job dengan klik tombol '''<code>Submit</code>'''. | Jalankan job dengan klik tombol '''<code>Submit</code>'''. | ||
[[Berkas:Jcsubmit2.png|al=|nirbing|600x600px]] | [[Berkas:Jcsubmit2.png|al=|nirbing|600x600px]] | ||
Berikut penjelasan kolom '''<code>Status</code>,''' pantau dengan refresh halaman job''':''' | |||
{| class="wikitable" | {| class="wikitable" | ||
!Status | !Status | ||
Baris 238: | Baris 269: | ||
|} | |} | ||
|- | |- | ||
|'''6B''' | |||
| | | | ||
Untuk menghentikan job yang tengah berjalan, klik tombol '''Stop'''. | Untuk menghentikan job yang tengah berjalan, klik tombol '''Stop'''. | ||
Baris 251: | Baris 283: | ||
User dapat '''menjalankan ulang ruang job yang sama''' (misalkan ketika ada koreksi file input atau Submit Script) dengan '''mengklik kembali tombol <code>Submit</code>'''. | User dapat '''menjalankan ulang ruang job yang sama''' (misalkan ketika ada koreksi file input atau Submit Script) dengan '''mengklik kembali tombol <code>Submit</code>'''. | ||
|} | |} | ||
== '''Notifikasi Status Jalannya Job Submission via email''' == | |||
SLURM ALELEON Supercomputer dapat mengirim notifikasi email kepada user '''untuk mengabarkan apabila job user sudah berjalan atau selesai'''. SLURM ALELEON Supercomputer menggunakan nama email '''Jojo''' untuk mengirim notifikasi email. | |||
Silahkan tambahan SBATCH berikut pada SLURM Submit Script (dapat ditambahkan setelah SBATCH error) apabila user ingin menerima notifikasi email dari SLURM: | |||
#SBATCH --mail-user='''<''alamat-email-user''>''' | |||
#SBATCH --mail-type=begin | |||
#SBATCH --mail-type=end | |||
* '''mail-user''' | |||
** Alamat email user untuk menerima notifikasi SLURM | |||
* '''mail-type=begin''' | |||
** Notifikasi email yang menginfokan job sudah berjalan. | |||
* '''mail-type=end''' | |||
** Notifikasi email yang menginfokan job sudah selesai. | |||
** Sekaligus memberikan cuplikan 20 baris terakhir dari file output SBATCH output dan error job user. |
Revisi per 6 Oktober 2023 03.51
COMCOT (Cornell Multi-grid Coupled Tsunami Grid) adalah software pemodelan tsunami yang menggunakan metode Shallow Water Equations.
Modul COMCOT
Berikut adalah detail versi COMCOT yang tersedia secara global di ALELEON Supercomputer:
Versi | Nama modul | Modul
DEFAULT |
Dukungan hardware | |||
---|---|---|---|---|---|---|
CPU | GPU | OMP
Threading |
MPI
multi-node | |||
1.7 | comcot/1.7cpu | V | V | - | - | - |
Menjalankan COMCOT
User dapat menjalankan COMCOT dengan pilihan cara menjalankan komputasi:
Terminal - SLURM sbatch
Menjalankan komputasi pada terminal melalui job submission SLURM sbatch. Tutorial ini mengasumsikan user dapat menggunakan terminal Linux.
Langkah Menjalankan COMCOT via SLURM sbatch | ||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | Sebelum login, user harus terhubung ke jaringan VPN ALELEON Supercomputer. Apabila sudah terhubung, user login dengan SSH:
| |||||||||||||||||||||
1 | Siapkan file yang dibutuhkan untuk menjalankan komputasi user.
| |||||||||||||||||||||
2 | Buat SLURM Submit Script yaitu semacam formulir untuk menjalankan job dengan panduan berikut:
#!/bin/bash # ------------------------------------------------------------------------ # | Template SLURM Submit Script # | Software : COMCOT (CPU) # | Versi : 1.7 # | Update script : 06/10/2023 # | # | NOTES: # | 1. Isi bagian yang ditandai 4 garing (////). # | 2. Template ini adalah referensi - user dapat mengubah bagian yang # | sekiranya perlu diubah. # | # | 3. Panduan mengisi alokasi komputasi (SBATCH) lihat: # | https://wiki.efisonlt.com/wiki/Submit_Script_ALELEON_Supercomputer # ------------------------------------------------------------------------ # -------------------------------------------------- # Alokasi komputasi, modul software, dan file input # -------------------------------------------------- # Alokasi jumlah core thread CPU #SBATCH --ntasks=//// # Alokasi jumlah memori RAM (satuan GB) #SBATCH --mem=////GB # Alokasi limit waktu menjalankan job. Format HH:MM:SS atau D-HH:MM:SS #SBATCH --time=//// # Definisi file untuk menampung output terminal #SBATCH --output=result-%j.txt # Definisi file untuk menampung output error log #SBATCH --error=error-%j.txt # Memuat modul COMCOT CPU versi 1.7 module load comcot/1.7cpu # ------------------------------------------------- # RUN SCRIPT # ------------------------------------------------- # Perintah menjakankan COMCOT comcot | |||||||||||||||||||||
3 | Jalankan job dengan perintah sbatch.
$ sbatch <nama-SLURM-Submit-script> Contoh menjalankan nama script $ sbatch slurmcomcot.sh | |||||||||||||||||||||
4A | User dapat melihat status jalannya job dengan perintah squeue dengan flag -ul $USER.
$ squeue -ul $USER Berikut adalah daftar STATE atau ST dari squeue yang menunjukkan status berjalannya job:
| |||||||||||||||||||||
4B | Apabila user ingin membatalkan job, gunakan perintah scancel berdasarkan job ID.
$ scancel <job-ID-submission-user> Contoh user membatalkan job submission milik user dengan ID 231. $ scancel 231 |
GUI Web - EFIRO Job Composer
Menjalankan komputasi dengan tampilan grafis pada formulir job submission EFIRO Job Composer.
Langkah Menjalankan COMCOT via EFIRO Job Composer | ||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | Sebelum login, user harus terhubung ke jaringan VPN ALELEON Supercomputer. Apabila sudah terhubung:
| |||||||||||||||
1 | Buka menu dashboard EFIRO Jobs > Jobs Composer
| |||||||||||||||
2 | Pilih New Jobs > From Template
| |||||||||||||||
3 |
| |||||||||||||||
4 |
| |||||||||||||||
5 |
Melalui
| |||||||||||||||
6A |
Jalankan job dengan klik tombol Berikut penjelasan kolom
| |||||||||||||||
6B |
Untuk menghentikan job yang tengah berjalan, klik tombol Stop. | |||||||||||||||
7A |
Hasil output job dapat dilihat pada kolom Folder Contents atau membuka halaman Edit Pages .
| |||||||||||||||
7B |
User dapat menjalankan ulang ruang job yang sama (misalkan ketika ada koreksi file input atau Submit Script) dengan mengklik kembali tombol |
Notifikasi Status Jalannya Job Submission via email
SLURM ALELEON Supercomputer dapat mengirim notifikasi email kepada user untuk mengabarkan apabila job user sudah berjalan atau selesai. SLURM ALELEON Supercomputer menggunakan nama email Jojo untuk mengirim notifikasi email.
Silahkan tambahan SBATCH berikut pada SLURM Submit Script (dapat ditambahkan setelah SBATCH error) apabila user ingin menerima notifikasi email dari SLURM:
#SBATCH --mail-user=<alamat-email-user> #SBATCH --mail-type=begin #SBATCH --mail-type=end
- mail-user
- Alamat email user untuk menerima notifikasi SLURM
- mail-type=begin
- Notifikasi email yang menginfokan job sudah berjalan.
- mail-type=end
- Notifikasi email yang menginfokan job sudah selesai.
- Sekaligus memberikan cuplikan 20 baris terakhir dari file output SBATCH output dan error job user.