Troubleshooting dan Support: Perbedaan antara revisi
Dari ALELEON by EFISON
WilsonLisan (bicara | kontrib) (initial writing) |
WilsonLisan (bicara | kontrib) (membuat section job pending) |
||
(1 revisi perantara oleh pengguna yang sama tidak ditampilkan) | |||
Baris 1: | Baris 1: | ||
Laman ini membahas langkah troubleshooting dan | Laman ini membahas langkah troubleshooting dan support ketika user menjumpai masalah selama pemakaian ALELEON Supercomputer. | ||
== '''''1. | * '''Silahkan pilih sesuai masalah yang dihadapi:''' | ||
{| class="wikitable" | |||
|- | |||
!Subbab | |||
!Kategori Masalah | |||
|- | |||
!<big>[ 1 ]</big> | |||
|Masalah pada '''<big>batch job:</big>''' | |||
* Job tidak berjalan atau tertahan | |||
* Job berjalan tidak sebagaimana mestinya. | |||
|- | |||
!<big>[ 2 ]</big> | |||
|Masalah pada '''<big>sesi interaktif</big>:''' | |||
* Untuk '''sesi Jupyter, ALELEON Desktop''' | |||
* Sesi tidak mulai / gagal berjalan. | |||
* Sesi berjalan tidak sebagaimana mestinya. | |||
|- | |||
! colspan="2" | | |||
|- | |||
! colspan="2" |Bila masalah user belum ada di laman ini: | |||
|- | |||
| colspan="2" |Hubungi tim admin via '''<big>support@efisonlt.com</big>''' | |||
|- | |||
! colspan="2" |--- | |||
|} | |||
== '''''1. Masalah pada Batch Job''''' == | |||
Dengan pembagian kategori: | |||
{| class="wikitable" | |||
![ 1.1 ] | |||
|Job tidak berjalan atau tertahan | |||
|- | |||
![ 1.2 ] | |||
|Job berjalan tidak sebagaimana mestinya. | |||
|} | |||
=== 1.1. Job Tidak Berjalan (state PENDING) === | |||
User dapat mencari '''alasan job yang tertahan''' melalui kode bernama '''<big>Reason</big>''': | |||
* Kode Reason memberikan alasan manajemen Slurm menahan job. | |||
{| class="wikitable" | |||
! colspan="2" |- Langkah mencari kode Reason - | |||
|- | |||
!<big>User terminal</big> | |||
!<big>User web EFIRO</big> | |||
|- | |||
! colspan="2" |<big><code>- / 1 / -</code></big> | |||
|- | |||
|Jalankan perintah: | |||
$ '''squeue -lu $USER''' | |||
* Cari job user yang '''<code>PENDING</code>'''. | |||
* Kode Reason lihat kolom '''<code>NODELIST(REASON)</code>''' | |||
|[[Berkas:Active Jobs detail.png|nirbing|400x400px]] | |||
* Buka menu '''<code><big>Apps > Active Jobs</big></code>''' | |||
* Di kanan atas, ubah opsi '''<code><big>All Jobs</big></code>''' ke '''<code><big>Your Jobs</big></code>''' | |||
* Klik kotak <big>'''>'''</big> pada job status Pending | |||
* Kode Reason ada pada kolom '''Reason'''. | |||
|- | |||
! colspan="2" |<big><code>- / 2 / -</code></big> | |||
|- | |||
|Penjelasan kode Reason lihat subbab '''<big>[ 3 ]</big>''' | |||
|Penjelasan kode Reason lihat subbab '''<big>[ 3 ]</big>''' | |||
|- | |||
! colspan="2" |--- | |||
|} | |||
=== 1.2. Job Berjalan Tidak Normal === | |||
Ketika job user berjalan tidak sebagaimana mestinya contoh terputus karena error: | |||
* Terdapat dua kemungkinan penyebab masalah, dari sisi user dan ALELEON. | |||
* Umumnya butuh kolaborasi user dan tim support. | |||
{| class="wikitable" | |||
! colspan="2" |- Kemungkinan penyebab masalah - | |||
|- | |||
!Sisi user | |||
!Sisi ALELEON Supercomputer | |||
|- | |||
| | |||
* Kesalahan mengisi submit script. | |||
* Kesalahan pada file komputasi, ex: | |||
** File tidak lengkap. | |||
** File input salah. | |||
* Kesalahan sintaks run job | |||
| | |||
* Kesalahan instalasi software. | |||
* Kesalahan panduan komputasi. | |||
* Masalah pada sistem ALELEON. | |||
|} | |||
== '''''2. Masalah pada Sesi Interaktif''''' == | |||
== '''''3. Daftar Kode Reason ALELEON Supercomputer''''' == |
Revisi terkini sejak 6 Juli 2025 12.43
Laman ini membahas langkah troubleshooting dan support ketika user menjumpai masalah selama pemakaian ALELEON Supercomputer.
- Silahkan pilih sesuai masalah yang dihadapi:
Subbab | Kategori Masalah |
---|---|
[ 1 ] | Masalah pada batch job:
|
[ 2 ] | Masalah pada sesi interaktif:
|
Bila masalah user belum ada di laman ini: | |
Hubungi tim admin via support@efisonlt.com | |
--- |
1. Masalah pada Batch Job
Dengan pembagian kategori:
[ 1.1 ] | Job tidak berjalan atau tertahan |
---|---|
[ 1.2 ] | Job berjalan tidak sebagaimana mestinya. |
1.1. Job Tidak Berjalan (state PENDING)
User dapat mencari alasan job yang tertahan melalui kode bernama Reason:
- Kode Reason memberikan alasan manajemen Slurm menahan job.
1.2. Job Berjalan Tidak Normal
Ketika job user berjalan tidak sebagaimana mestinya contoh terputus karena error:
- Terdapat dua kemungkinan penyebab masalah, dari sisi user dan ALELEON.
- Umumnya butuh kolaborasi user dan tim support.
- Kemungkinan penyebab masalah - | |
---|---|
Sisi user | Sisi ALELEON Supercomputer |
|
|