COMCOT: Perbedaan antara revisi
WilsonLisan (bicara | kontrib) (italic deskripsi gambar) |
WilsonLisan (bicara | kontrib) (→Opsi Menggunakan terminal (SLURM sbatch): testing paraphrasing) |
||
Baris 36: | Baris 36: | ||
|'''0''' | |'''0''' | ||
| | | | ||
Lakukan [https://wiki.efisonlt.com/wiki/Menggunakan_ALELEON_Supercomputer_via_Terminal#1_|_Login_SSH '''login SSH ke ALELEON Supercomputer''']. | |||
|- | |- | ||
|'''1''' | |'''1''' | ||
| | | | ||
Siapkan file yang dibutuhkan untuk komputasi user | |||
Siapkan file yang dibutuhkan untuk komputasi user | *User dapat upload / download file dengan [[Upload File dengan Aplikasi FTP|'''software FTP''']]. | ||
|- | |- | ||
| rowspan="2" |'''2''' | | rowspan="2" |'''2''' | ||
| | | | ||
Buat '''Slurm Submit Script''' yaitu "formulir" untuk menjalankan komputasi. | |||
* Format file .sh (bash), nama bebas. Contoh: <code>my_job_submission.sh</code> | |||
* Berikut contoh template untuk COMCOT, ikuti petunjuk NOTES di dalamnya: | |||
{| class="wikitable mw-collapsible mw-collapsed" | {| class="wikitable mw-collapsible mw-collapsed" | ||
!Template | !Template Submit Script untuk COMCOT | ||
|- | |- | ||
|<syntaxhighlight lang="bash" line="1"> | |<syntaxhighlight lang="bash" line="1"> | ||
Baris 102: | Baris 100: | ||
|- | |- | ||
| | | | ||
{| class="wikitable mw-collapsible mw-collapsed" | {| class="wikitable mw-collapsible mw-collapsed" | ||
! colspan="5" |Panduan Nilai Maksimal SBATCH ntasks, mem, gpus, time | ! colspan="5" |Panduan Nilai Maksimal SBATCH ntasks, mem, gpus, time | ||
Baris 148: | Baris 146: | ||
***ntasks * time (jam) lebih besar dari sisa CPU Core Hour user. | ***ntasks * time (jam) lebih besar dari sisa CPU Core Hour user. | ||
***gpus * time (jam) lebih besar dari sisa GPU Hour user. | ***gpus * time (jam) lebih besar dari sisa GPU Hour user. | ||
**Cek sisa Kredit Core Hour melalui perintah | **Cek sisa Kredit Core Hour melalui perintah '''<code>sausage</code>''' | ||
*Info SBATCH lebih detail lihat laman [[Submit Script ALELEON Supercomputer|'''Submit Script ALELEON Supercomputer''']] | *Info SBATCH lebih detail lihat laman [[Submit Script ALELEON Supercomputer|'''Submit Script ALELEON Supercomputer''']] | ||
|} | |} | ||
Baris 155: | Baris 153: | ||
|'''3''' | |'''3''' | ||
| | | | ||
Jalankan job dengan perintah sbatch: | |||
Jalankan job dengan perintah sbatch | |||
$ '''sbatch''' '''''<nama-SLURM-Submit-script>''''' | $ '''sbatch''' '''''<nama-SLURM-Submit-script>''''' | ||
Contoh menjalankan | Contoh menjalankan script <code>my_job_submission.sh</code>. | ||
$ sbatch my_job_submission.sh | $ sbatch my_job_submission.sh | ||
|- | |- | ||
|'''4A''' | |'''4A''' | ||
|User dapat melihat status jalannya job dengan perintah squeue | |User dapat melihat status jalannya job dengan perintah squeue: | ||
$ '''squeue -ul $USER''' | $ '''squeue -ul $USER''' | ||
Berikut adalah daftar STATE (ST) | *Apabila tidak ada output artinya tidak ada job user yang sedang berjalan / antri. | ||
* Berikut adalah daftar STATE (ST) yang menunjukkan status jalannya job: | |||
{| class="wikitable" | {| class="wikitable" | ||
|+Daftar STATE squeue | |+Daftar STATE squeue Slurm | ||
!STATE | ! colspan="2" |STATE | ||
!Penjelasan | !Penjelasan | ||
|- | |- | ||
| R | | R | ||
|RUN | |RUN | ||
|Job berjalan | |Job berjalan | ||
|- | |- | ||
|PD | |PD | ||
|PENDING | |PENDING | ||
|Job tertahan, lihat keterangan [[Daftar Reason NODELIST ALELEON Supercomputer|'''NODELIST(REASON)''']] | |Job tertahan, lihat keterangan [[Daftar Reason NODELIST ALELEON Supercomputer|'''NODELIST(REASON)''']] | ||
|- | |- | ||
|CG | |CG | ||
| COMPLETING | |COMPLETING | ||
|Job selesai dan dalam proses clean-up | |Job selesai dan dalam proses clean-up | ||
|- | |- | ||
|CA | |CA | ||
|CANCELED | |CANCELED | ||
|Job dibatalkan oleh user | |Job dibatalkan oleh user | ||
|- | |- | ||
|PR | |PR | ||
|PREEMPETED | |PREEMPETED | ||
|Job dibatalkan oleh admin EFISON | |Job dibatalkan oleh admin EFISON. | ||
* alasan dikabarkan melalui email ke user. | |||
|- | |- | ||
|S | |S | ||
|SUSPENDED | |SUSPENDED | ||
|Job ditahan oleh admin EFISON | |Job ditahan oleh admin EFISON | ||
|} | |} | ||
Baris 199: | Baris 199: | ||
|'''4B''' | |'''4B''' | ||
| | | | ||
Apabila user ingin membatalkan job, gunakan perintah scancel: | |||
Apabila user ingin membatalkan job, gunakan perintah scancel | $ '''scancel <''job-ID-submission-user''>''' | ||
*Job ID dapat dilihat melalui perintah squeue pada kolom JOBID. | *Job ID dapat dilihat melalui perintah squeue pada kolom JOBID. | ||
*User hanya bisa membatalkan job submission milik user sendiri. | *User hanya bisa membatalkan job submission milik user sendiri. | ||
*Contoh user membatalkan job submission ID 231: | |||
Contoh user membatalkan job submission | |||
$ scancel 231 | $ scancel 231 | ||
|} | |} |
Revisi per 23 Februari 2024 09.28
COMCOT (Cornell Multi-grid Coupled Tsunami Grid) adalah software pemodelan tsunami yang menggunakan metode Shallow Water Equations.
Modul COMCOT
Berikut adalah detail versi COMCOT yang tersedia secara global di ALELEON Supercomputer:
Versi | Nama modul | Modul
DEFAULT |
Dukungan hardware | |||
---|---|---|---|---|---|---|
CPU | GPU | OMP
Threading |
MPI
multi-node | |||
1.7 | comcot/1.7cpu | V | V | - | - | - |
Menjalankan COMCOT
User dapat menjalankan komputasi dengan pilihan cara melalui terminal atau website EFIRO (klik expand atau kembangkan).
Opsi Menggunakan terminal (SLURM sbatch)
Langkah Menjalankan COMCOT di Terminal | ||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 |
Lakukan login SSH ke ALELEON Supercomputer. | |||||||||||||||||||||||||||||||||||||
1 |
Siapkan file yang dibutuhkan untuk komputasi user
| |||||||||||||||||||||||||||||||||||||
2 |
Buat Slurm Submit Script yaitu "formulir" untuk menjalankan komputasi.
| |||||||||||||||||||||||||||||||||||||
| ||||||||||||||||||||||||||||||||||||||
3 |
Jalankan job dengan perintah sbatch: $ sbatch <nama-SLURM-Submit-script> Contoh menjalankan script $ sbatch my_job_submission.sh | |||||||||||||||||||||||||||||||||||||
4A | User dapat melihat status jalannya job dengan perintah squeue:
$ squeue -ul $USER
| |||||||||||||||||||||||||||||||||||||
4B |
Apabila user ingin membatalkan job, gunakan perintah scancel: $ scancel <job-ID-submission-user>
$ scancel 231 |
Opsi Menggunakan Web EFIRO (EFIRO Job Composer)
Langkah Menjalankan COMCOT di Web EFIRO | ||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 |
Login Web EFIRO
| |||||||||||||||||||||||||||||||||||||
1 |
Membuka Job Composer dan Memilih Template Job
| |||||||||||||||||||||||||||||||||||||
2 | ![]()
| |||||||||||||||||||||||||||||||||||||
3 |
Menyiapkan File KomputasiGunakan menu
| |||||||||||||||||||||||||||||||||||||
4 |
Melengkapi Submit ScriptSubmit Script adalah "formulir" untuk menjalankan job komputasi user.
| |||||||||||||||||||||||||||||||||||||
Panduan Nilai Maksimal SBATCH
| ||||||||||||||||||||||||||||||||||||||
5 |
Menjalankan Job KomputasiJalankan job dengan klik tombol
Menghentikan Job KomputasiUntuk menghentikan job yang tengah berjalan, klik tombol | |||||||||||||||||||||||||||||||||||||
6A |
Melihat Output KomputasiUser dapat melihat output file komputasi pada kolom
| |||||||||||||||||||||||||||||||||||||
6B | User dapat menjalankan ulang ruang job yang sama dengan mengklik kembali tombol Submit .
|
Notifikasi Status Jalannya Komputasi via email
SLURM ALELEON Supercomputer dapat mengirim notifikasi email kepada user dengan nama "Jojo" untuk mengabarkan status berjalannya job komputasi user. Silahkan tambahan SBATCH berikut pada Submit Script apabila user ingin menerima notifikasi email dari SLURM:
#SBATCH --mail-user=<alamat-email-user>
#SBATCH --mail-type=BEGIN,END,FAIL
SBATCH mail-type mengatur konten email notifikasi SLURM dengan pilihan opsi yang sekiranya berguna untuk user:
- BEGIN -> notifikasi job sudah mulai
- END -> notifikasi job sudah selesai beserta cuplikan 20 baris terakhir dari file SBATCH output dan error.
- FAIL -> notifikasi apabila job gagal berjalan atau berhenti tidak sewajarnya.
- TIME_LIMIT_50 -> job telah berjalan dengan durasi waktu 50% time limit.
- TIME_LIMIT_80 -> job telah berjalan dengan durasi waktu 80% time limit.
Pelaporan Kendala dan Support
Apabila menjumpai masalah teknis dalam menjalankan komputasi, silahkan lapor dengan klik gambar berikut ini.
---
Bila terdapat pertanyaan lainnya, silahkan hubungi admin EFISON melalui email:
support@efisonlt.com