COMCOT: Perbedaan antara revisi
WilsonLisan (bicara | kontrib) (paraphrasing) |
WilsonLisan (bicara | kontrib) (overhaul wiki comcot 120124) |
||
Baris 26: | Baris 26: | ||
|} | |} | ||
== '''Menjalankan COMCOT | == '''Menjalankan COMCOT''' == | ||
User dapat menjalankan komputasi dengan pilihan cara melalui | User dapat menjalankan komputasi dengan pilihan cara melalui terminal atau website EFIRO ''(klik expand atau kembangkan)''. | ||
=== | === Opsi Menggunakan terminal (SLURM sbatch) === | ||
{| class="wikitable mw-collapsible mw-collapsed" | |||
! colspan="2" |Langkah Menjalankan COMCOT di Terminal | |||
= | |||
[[Berkas:Sbatch Terminal.png|nirbing|500x500px]] | [[Berkas:Sbatch Terminal.png|nirbing|500x500px]] | ||
|- | |- | ||
|'''0''' | |||
| | | | ||
=====Login SSH===== | |||
Tatacara login SSH lihat laman [https://wiki.efisonlt.com/wiki/Menggunakan_ALELEON_Supercomputer_via_Terminal#1_|_Login_SSH '''Login SSH ALELEON Supercomputer''']. | |||
|- | |||
|'''1''' | |||
| | |||
=====Menyiapkan File Komputasi===== | |||
Siapkan file yang dibutuhkan untuk komputasi user, rekomendasi dalam satu folder per job: | |||
*File input dan data komputasi. | |||
**User dapat upload / download file ke ALELEON dengan [[Upload File dengan Aplikasi FTP|'''software FTP''']]. | |||
* Membuat '''SLURM Submit Script''' yaitu 'formulir' untuk menjalankan job komputasi. | |||
**Nama script bebas dengan format file .sh (bash), contoh ''<code>my_job_submission.sh</code>'' | |||
$ mkdir kerjaanskripsi | |||
$ cd kerjaanskripsi | |||
$ touch my_job_submission.sh | |||
''... upload / menyiapkan data input komputasi dll ...'' | |||
|- | |- | ||
| | | rowspan="2" |'''2''' | ||
| | |||
=====Template SLURM Submit Script COMCOT ===== | |||
Ikuti panduan template berikut dan petunjuk NOTES di dalamnya. | |||
{| class="wikitable mw-collapsible mw-collapsed" | |||
!Template SLURM Submit Script untuk COMCOT | |||
|- | |- | ||
| | |<syntaxhighlight lang="bash" line="1"> | ||
| | #!/bin/bash | ||
# ----------------------------------------------------- | |||
# Template SLURM Submit Script | |||
# COMCOT | rev.080124 | |||
# | |||
# NOTES: | |||
# 1. Isi bagian yang ditandai 4 garing (////). | |||
# 2. Template ini bersifat referensi. | |||
# User dapat mengubah bagian yang perlu diubah. | |||
# ----------------------------------------------------- | |||
# ----------------------------------------------------- | |||
# Alokasi komputasi SBATCH, input, dan module | |||
# ----------------------------------------------------- | |||
# Alokasi jumlah core thread CPU | |||
#SBATCH --ntasks=//// | |||
# Alokasi jumlah memori RAM (satuan GB) | |||
#SBATCH --mem=////GB | |||
# Alokasi limit waktu menjalankan job | |||
# Format HH:MM:SS atau D-HH:MM:SS | |||
#SBATCH --time=//// | |||
# Definisi file untuk menampung output terminal program | |||
#SBATCH --output=result-%j.txt | |||
# Definisi file untuk menampung output error log | |||
#SBATCH --error=error-%j.txt | |||
# Memuat modul software COMCOT | |||
# Daftar modul lihat subbab "Modul COMCOT" di atas | |||
module load comcot//// | |||
# ---------------------------------------------------- | |||
# Script jalannya program | |||
# ---------------------------------------------------- | |||
# Perintah menjakankan COMCOT | |||
comcot | |||
</syntaxhighlight> | |||
|} | |||
|- | |- | ||
| | | | ||
=====Panduan Nilai Maksimal SBATCH===== | |||
{| class="wikitable mw-collapsible mw-collapsed" | |||
! colspan="5" |Panduan Nilai Maksimal SBATCH ntasks, mem, gpus, time | |||
{| class="wikitable" | |||
! colspan=" | |||
|- | |- | ||
! | !Skenario Komputasi | ||
! | !ntasks | ||
! | (CPU) | ||
! | !mem | ||
(RAM) | |||
!gpus | |||
(GPU) | |||
!time | |||
(time limit) | |||
|- | |- | ||
| | |Fair policy usage untuk akumulasi semua job<sup>''1''</sup> | ||
|128 | |128 | ||
|128GB | |||
|2 | |||
| rowspan="3" |3-00:00:00 | |||
atau | |||
72:00:00 | |||
|- | |||
| COMCOT | |||
|128 | |128 | ||
| 240GB | |||
|0 | |||
|- | |||
|COMCOT di high-mem node | |||
*Tambahkan <code>#SBATCH --nodelist=epyc001</code> | |||
|128 | |128 | ||
|500GB | |500GB | ||
|0 | |||
|- | |- | ||
| colspan="5" |'''''Keterangan:''''' | |||
| colspan=" | #Limitasi untuk menjaga kualitas layanan ALELEON Supercomputer.#* User dapat mengajukan permintaan buka limitasi apabila butuh alokasi lebih. | ||
#*Info detail buka laman [[Limitasi Fair Usage ALELEON Supercomputer|'''Limitasi Fair Usage ALELEON Supercomputer''']]. | |||
|- | |- | ||
! colspan="5" |Keterangan tambahan | |||
|- | |- | ||
| | | colspan="5" | | ||
* '''Untuk akun perseorangan dengan Kredit Core Hour:''' | |||
**SLURM akan menahan job apabila: | |||
***ntasks * time (jam) lebih besar dari sisa CPU Core Hour user. | |||
***gpus * time (jam) lebih besar dari sisa GPU Hour user. | |||
**Cek sisa Kredit Core Hour melalui perintah: | |||
$ '''sausage''' | |||
*Info SBATCH lebih detail lihat laman [[Submit Script ALELEON Supercomputer|'''Submit Script ALELEON Supercomputer''']] | |||
|} | |} | ||
|- | |- | ||
|'''3''' | |'''3''' | ||
|Jalankan job dengan perintah sbatch. | | | ||
=====Menjalankan Job Komputasi===== | |||
Jalankan job dengan perintah sbatch. | |||
$ '''sbatch''' '''''<nama-SLURM-Submit-script>''''' | $ '''sbatch''' '''''<nama-SLURM-Submit-script>''''' | ||
Contoh menjalankan nama script <code>my_job_submission.sh</code>. | Contoh menjalankan nama script <code>my_job_submission.sh</code>. | ||
$ sbatch my_job_submission.sh | $ sbatch my_job_submission.sh | ||
|- | |- | ||
|'''4A''' | |'''4A''' | ||
|User dapat melihat status jalannya job dengan perintah squeue berikut. | |User dapat melihat status jalannya job dengan perintah squeue berikut. | ||
*Apabila tidak ada output artinya tidak ada job user yang berjalan / antri pada waktu itu. | |||
* Apabila tidak ada output artinya tidak ada job user yang berjalan / antri pada waktu itu. | |||
$ '''squeue -ul $USER''' | $ '''squeue -ul $USER''' | ||
Berikut adalah daftar STATE (ST) dari squeue yang menunjukkan status berjalannya job: | Berikut adalah daftar STATE (ST) dari squeue yang menunjukkan status berjalannya job: | ||
{| class="wikitable" | {| class="wikitable" | ||
|+Daftar STATE squeue SLURM | |+Daftar STATE squeue SLURM | ||
!STATE | !STATE | ||
!Kepanjangan | !Kepanjangan | ||
!Penjelasan | !Penjelasan | ||
|- | |- | ||
|R | | R | ||
|RUN | |RUN | ||
|Job berjalan | |Job berjalan | ||
Baris 174: | Baris 185: | ||
|- | |- | ||
|CG | |CG | ||
|COMPLETING | | COMPLETING | ||
|Job selesai dan dalam proses clean-up SLURM | |Job selesai dan dalam proses clean-up SLURM | ||
|- | |- | ||
Baris 186: | Baris 197: | ||
|- | |- | ||
|S | |S | ||
|SUSPENDED | |SUSPENDED | ||
|Job ditahan oleh admin EFISON | |Job ditahan oleh admin EFISON | ||
|} | |} | ||
|- | |- | ||
|'''4B''' | |'''4B''' | ||
|Apabila user ingin membatalkan job, gunakan perintah scancel berdasarkan job ID. | | | ||
=====Menghentikan Job Komputasi===== | |||
* Job ID dapat dilihat melalui perintah squeue pada kolom JOBID. | Apabila user ingin membatalkan job, gunakan perintah scancel berdasarkan job ID. | ||
* User hanya bisa membatalkan job submission milik user sendiri. | *Job ID dapat dilihat melalui perintah squeue pada kolom JOBID. | ||
*User hanya bisa membatalkan job submission milik user sendiri. | |||
$ '''scancel <''job-ID-submission-user''>''' | $ '''scancel <''job-ID-submission-user''>''' | ||
Contoh user membatalkan job submission milik user dengan ID 231. | Contoh user membatalkan job submission milik user dengan ID 231. | ||
$ scancel 231 | $ scancel 231 | ||
|} | |} | ||
=== Opsi Menggunakan Web EFIRO (EFIRO Job Composer) === | |||
=== | {| class="wikitable mw-collapsible mw-collapsed" | ||
! colspan="2" |Langkah Menjalankan COMCOT di Web EFIRO | |||
[[Berkas:Efirojobcomposer3.png|nirbing|500x500px]] | [[Berkas:Efirojobcomposer3.png|nirbing|500x500px]] | ||
|- | |- | ||
|'''0''' | |||
| | | | ||
=====Login Web EFIRO===== | |||
*[[Koneksi VPN ALELEON Supercomputer|'''User harus terhubung ke jaringan VPN ALELEON Supercomputer''']]. | |||
* Bagi user Linux, buka alamat <code>'''<nowiki>http://10.192.50.11</nowiki>'''</code> | *Buka alamat web '''<code><nowiki>http://aleleon.ood</nowiki></code>''' lalu masukkan username dan password user. | ||
**Bagi user Linux, buka alamat <code>'''<nowiki>http://10.192.50.11</nowiki>'''</code> | |||
|- | |- | ||
|'''1''' | |'''1''' | ||
|Buka menu | |=====Membuka Job Composer dan Memilih Template Job=====*Buka menu '''<code>Jobs</code>''' > '''<code>Jobs Composer</code>''' pada dashboard EFIRO. | ||
[[Berkas:Efirojobcomposermenu.png| | *Pilih '''<code>New Job</code>''' > '''<code>From Template</code>''' | ||
[[Berkas:Efirojobcomposermenu.png|nir|jmpl|Menu '''<code>Jobs</code> > <code>Jobs Composer</code>''']][[Berkas:Jcnewjobmarked.png|al=|nir|jmpl|220x220px|Menu '''<code>New Jobs</code>''' > '''<code>From Template</code>''']] | |||
|- | |- | ||
|'''2''' | |'''2''' | ||
| | |[[Berkas:Jcselecttemplate3.png|nirbing|600x600px]] | ||
[[Berkas: | *PIlih template COMCOT yang diinginkan. | ||
*Isi atau ganti kolom '''<code>Job Name</code>''' sesuai keinginan user. | |||
*Apabila sudah selesai, klik '''<code>Create New Job</code>'''. | |||
{| class="wikitable" | {| class="wikitable" | ||
! colspan="2" |Template COMCOT yang tersedia | ! colspan="2" |Template COMCOT yang tersedia | ||
Baris 234: | Baris 243: | ||
|} | |} | ||
|- | |- | ||
|''' | |'''3''' | ||
| | | | ||
=====Menyiapkan File Komputasi===== | |||
[[Berkas:Jcjoboption3.png|nirbing|600x600px]] | [[Berkas:Jcjoboption3.png|nirbing|600x600px]] | ||
Gunakan menu ''' | Gunakan menu <code>'''Edit Files'''</code> untuk upload file komputasi yang dibutuhkan. | ||
*Laman Edit Files juga dapat melakukan | *Laman Edit Files juga dapat melakukan download / edit / rename / delete file. | ||
* | *Fitur upload pada Edit Files mempunyai limit kapasitas '''2GB per file'''. | ||
** | ** Gunakan [[Upload File dengan Aplikasi FTP|'''aplikasi FTP''']] untuk upload file tunggal diatas 2GB. | ||
|- | |||
| rowspan="2" |'''4''' | |||
| | |||
===== Melengkapi Submit Script===== | |||
Submit Script adalah "formulir" untuk menjalankan job komputasi user. | |||
*Lengkapi Submit Script melalui menu '''<code>Open Editor</code>'''. | |||
*Ikuti petunjuk NOTES di dalamnya. | |||
*Jangan lupa klik <code>'''Save'''</code> setiap sekali mengubah script. | |||
[[Berkas:Jceditor3.png|al=|nirbing|500x500px]] | |||
|- | |- | ||
| | | | ||
=====Panduan Nilai Maksimal SBATCH===== | |||
{| class="wikitable mw-collapsible mw-collapsed" | |||
! colspan="5" |Panduan Nilai Maksimal SBATCH ntasks, mem, gpus, time | |||
{| class="wikitable" | |||
! colspan=" | |||
|- | |- | ||
! | !Skenario Komputasi | ||
! | !ntasks | ||
! | (CPU) | ||
! | !mem | ||
(RAM) | |||
!gpus | |||
(GPU) | |||
!time | |||
(time limit) | |||
|- | |- | ||
| | |Fair policy usage untuk akumulasi semua job<sup>''1''</sup> | ||
|128 | |128 | ||
|128GB | |||
|2 | |||
| rowspan="3" |3-00:00:00 | |||
atau | |||
72:00:00 | |||
|- | |||
|COMCOT | |||
|128 | |128 | ||
|240GB | |||
|0 | |||
|- | |||
|COMCOT di high-mem node | |||
*Tambahkan <code>#SBATCH --nodelist=epyc001</code> | |||
|128 | |128 | ||
| 500GB | |||
|0 | |||
|- | |- | ||
| | | colspan="5" |'''''Keterangan:''''' | ||
| | #Limitasi untuk menjaga kualitas layanan ALELEON Supercomputer.#*User dapat mengajukan permintaan buka limitasi apabila butuh alokasi lebih. | ||
#*Info detail buka laman [[Limitasi Fair Usage ALELEON Supercomputer|'''Limitasi Fair Usage ALELEON Supercomputer''']]. | |||
| | |||
|- | |- | ||
! colspan="5" |Keterangan tambahan | |||
|- | |- | ||
|gpus (GPU | | colspan="5" | | ||
| | *'''Untuk akun perseorangan dengan Kredit Core Hour:''' | ||
| | **SLURM akan menahan job apabila: | ||
| | ***ntasks * time (jam) lebih besar dari sisa CPU Core Hour user. | ||
***gpus * time (jam) lebih besar dari sisa GPU Hour user. | |||
**Cek sisa Kredit Core Hour melalui menu '''<code>Open Terminal</code>''' dan jalankan perintah: | |||
$ '''sausage''' | |||
[[Berkas:Jcjoboption4.png|nirbing|600x600px]] | |||
*Info SBATCH lebih detail lihat laman [[Submit Script ALELEON Supercomputer|'''Submit Script ALELEON Supercomputer''']] | |||
|} | |} | ||
|- | |- | ||
|''' | |'''5''' | ||
| | | | ||
=====Menjalankan Job Komputasi===== | |||
Jalankan job dengan klik tombol '''<code>Submit</code>'''. | Jalankan job dengan klik tombol '''<code>Submit</code>'''. | ||
[[Berkas:Jcsubmit2.png|al=|nirbing|600x600px]] | [[Berkas:Jcsubmit2.png|al=|nirbing|600x600px]] | ||
{| class="wikitable" | {| class="wikitable" | ||
|+''Penjelasan kolom '''<code>Status</code>,''' pantau dengan refresh halaman job'' | |||
!Status | !Status | ||
!Arti | !Arti | ||
|- | |- | ||
| Not Submitted | |Not Submitted | ||
|Job belum pernah dijalankan. | |Job belum pernah dijalankan. | ||
|- | |- | ||
Baris 304: | Baris 333: | ||
|Queue | |Queue | ||
|Job mengantri dan belum berjalan. | |Job mengantri dan belum berjalan. | ||
{| class="wikitable mw-collapsible mw-collapsed" | |||
!Langkah melihat status job ketika queue | |||
|- | |||
|Buka <code>'''Jobs > Active Jobs'''</code> pada dashboard EFIRO. | |||
*Lakukan langkah sesuai gambar dibawah ini | |||
[[Berkas:Efiroqueueedit.png|al=|jmpl|''Halaman Active Jobs. Ubah opsi '''<code>Your jobs</code>''' untuk melihat status job user saja. Klik simbol '''>''' untuk melihat status job pending pada kolom '''Reason'''. Arti reason lihat laman '''[[Daftar Reason NODELIST ALELEON Supercomputer]].'''''|kiri]] | |||
|} | |||
|- | |- | ||
|Completed | |Completed | ||
Baris 311: | Baris 347: | ||
|Job berhenti di tengah jalan, bisa karena di Stop atau Delete oleh user. | |Job berhenti di tengah jalan, bisa karena di Stop atau Delete oleh user. | ||
|} | |} | ||
=====Menghentikan Job Komputasi===== | |||
Untuk menghentikan job yang tengah berjalan, klik tombol '''<code>Stop</code>'''. | |||
Untuk menghentikan job yang tengah berjalan, klik tombol '''Stop'''. | |||
[[Berkas:Stop.png|nirbing|600x600px]] | [[Berkas:Stop.png|nirbing|600x600px]] | ||
|- | |- | ||
|''' | |'''6A''' | ||
| | | | ||
=====Melihat Output Komputasi===== | |||
User dapat melihat output file komputasi pada kolom '''<code>Folder Contents</code>''' | |||
*Atau dengan membuka '''<code>Edit Files</code>''' | |||
[[Berkas:Jcfoldercontentsedit.png|al=|nir|jmpl|Kolom '''<code>Folder Contents</code>'''.]] | |||
|- | |- | ||
|''' | |'''6B''' | ||
| | |User dapat '''menjalankan ulang ruang job yang sama''' dengan mengklik kembali tombol '''<code>Submit</code>'''. | ||
User dapat '''menjalankan ulang ruang job yang sama''' dengan mengklik kembali tombol '''<code>Submit</code>'''. | |||
|} | |} | ||
== '''Notifikasi Status Jalannya Komputasi via email''' == | == '''Notifikasi Status Jalannya Komputasi via email''' == | ||
SLURM ALELEON Supercomputer dapat mengirim notifikasi email kepada user dengan nama "Jojo" untuk mengabarkan status berjalannya job komputasi user. Silahkan tambahan SBATCH berikut pada | SLURM ALELEON Supercomputer dapat mengirim notifikasi email kepada user dengan nama "Jojo" untuk mengabarkan status berjalannya job komputasi user. Silahkan tambahan SBATCH berikut pada Submit Script apabila user ingin menerima notifikasi email dari SLURM:<syntaxhighlight lang="bash"> | ||
#SBATCH --mail-user=<alamat-email-user> | |||
#SBATCH --mail-type=BEGIN,END,FAIL | |||
</syntaxhighlight>SBATCH mail-type mengatur konten email notifikasi SLURM dengan pilihan opsi yang sekiranya berguna untuk user: | |||
*BEGIN -> notifikasi job sudah mulai | |||
*END -> notifikasi job sudah selesai beserta cuplikan 20 baris terakhir dari file SBATCH output dan error. | |||
*FAIL -> notifikasi apabila job gagal berjalan atau berhenti tidak sewajarnya. | |||
* | *TIME_LIMIT_50 -> job telah berjalan dengan durasi waktu 50% time limit. | ||
*TIME_LIMIT_80 -> job telah berjalan dengan durasi waktu 80% time limit. | |||
* | |||
== '''Pelaporan Kendala dan Support''' == | == '''Pelaporan Kendala dan Support''' == | ||
Apabila menjumpai masalah teknis dalam menjalankan komputasi | Apabila menjumpai masalah teknis dalam menjalankan komputasi, silahkan lapor dengan klik gambar berikut ini. | ||
[[Berkas:Wiki-pelaporankendala.jpg|1000x1000px|link=https://efisonlt.com/aleleonbugreport]] | [[Berkas:Wiki-pelaporankendala.jpg|1000x1000px|link=https://efisonlt.com/aleleonbugreport]] |
Revisi per 12 Januari 2024 03.53
COMCOT (Cornell Multi-grid Coupled Tsunami Grid) adalah software pemodelan tsunami yang menggunakan metode Shallow Water Equations.
Modul COMCOT
Berikut adalah detail versi COMCOT yang tersedia secara global di ALELEON Supercomputer:
Versi | Nama modul | Modul
DEFAULT |
Dukungan hardware | |||
---|---|---|---|---|---|---|
CPU | GPU | OMP
Threading |
MPI
multi-node | |||
1.7 | comcot/1.7cpu | V | V | - | - | - |
Menjalankan COMCOT
User dapat menjalankan komputasi dengan pilihan cara melalui terminal atau website EFIRO (klik expand atau kembangkan).
Opsi Menggunakan terminal (SLURM sbatch)
Langkah Menjalankan COMCOT di Terminal | ||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 |
Login SSHTatacara login SSH lihat laman Login SSH ALELEON Supercomputer. | |||||||||||||||||||||||||||||||||||||
1 |
Menyiapkan File KomputasiSiapkan file yang dibutuhkan untuk komputasi user, rekomendasi dalam satu folder per job:
$ mkdir kerjaanskripsi $ cd kerjaanskripsi $ touch my_job_submission.sh ... upload / menyiapkan data input komputasi dll ... | |||||||||||||||||||||||||||||||||||||
2 |
Template SLURM Submit Script COMCOTIkuti panduan template berikut dan petunjuk NOTES di dalamnya.
| |||||||||||||||||||||||||||||||||||||
Panduan Nilai Maksimal SBATCH
| ||||||||||||||||||||||||||||||||||||||
3 |
Menjalankan Job KomputasiJalankan job dengan perintah sbatch. $ sbatch <nama-SLURM-Submit-script> Contoh menjalankan nama script $ sbatch my_job_submission.sh | |||||||||||||||||||||||||||||||||||||
4A | User dapat melihat status jalannya job dengan perintah squeue berikut.
$ squeue -ul $USER Berikut adalah daftar STATE (ST) dari squeue yang menunjukkan status berjalannya job:
| |||||||||||||||||||||||||||||||||||||
4B |
Menghentikan Job KomputasiApabila user ingin membatalkan job, gunakan perintah scancel berdasarkan job ID.
$ scancel <job-ID-submission-user> Contoh user membatalkan job submission milik user dengan ID 231. $ scancel 231 |
Opsi Menggunakan Web EFIRO (EFIRO Job Composer)
Langkah Menjalankan COMCOT di Web EFIRO | ||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 |
Login Web EFIRO
| |||||||||||||||||||||||||||||||||||||
1 | =====Membuka Job Composer dan Memilih Template Job=====*Buka menu Jobs > Jobs Composer pada dashboard EFIRO.
| |||||||||||||||||||||||||||||||||||||
2 | ![]()
| |||||||||||||||||||||||||||||||||||||
3 |
Menyiapkan File KomputasiGunakan menu
| |||||||||||||||||||||||||||||||||||||
4 |
Melengkapi Submit ScriptSubmit Script adalah "formulir" untuk menjalankan job komputasi user.
| |||||||||||||||||||||||||||||||||||||
Panduan Nilai Maksimal SBATCH
| ||||||||||||||||||||||||||||||||||||||
5 |
Menjalankan Job KomputasiJalankan job dengan klik tombol
Menghentikan Job KomputasiUntuk menghentikan job yang tengah berjalan, klik tombol | |||||||||||||||||||||||||||||||||||||
6A |
Melihat Output KomputasiUser dapat melihat output file komputasi pada kolom
| |||||||||||||||||||||||||||||||||||||
6B | User dapat menjalankan ulang ruang job yang sama dengan mengklik kembali tombol Submit .
|
Notifikasi Status Jalannya Komputasi via email
SLURM ALELEON Supercomputer dapat mengirim notifikasi email kepada user dengan nama "Jojo" untuk mengabarkan status berjalannya job komputasi user. Silahkan tambahan SBATCH berikut pada Submit Script apabila user ingin menerima notifikasi email dari SLURM:
#SBATCH --mail-user=<alamat-email-user>
#SBATCH --mail-type=BEGIN,END,FAIL
SBATCH mail-type mengatur konten email notifikasi SLURM dengan pilihan opsi yang sekiranya berguna untuk user:
- BEGIN -> notifikasi job sudah mulai
- END -> notifikasi job sudah selesai beserta cuplikan 20 baris terakhir dari file SBATCH output dan error.
- FAIL -> notifikasi apabila job gagal berjalan atau berhenti tidak sewajarnya.
- TIME_LIMIT_50 -> job telah berjalan dengan durasi waktu 50% time limit.
- TIME_LIMIT_80 -> job telah berjalan dengan durasi waktu 80% time limit.
Pelaporan Kendala dan Support
Apabila menjumpai masalah teknis dalam menjalankan komputasi, silahkan lapor dengan klik gambar berikut ini.
---
Bila terdapat pertanyaan lainnya, silahkan hubungi admin EFISON melalui email:
support@efisonlt.com