Troubleshooting dan Support: Perbedaan antara revisi

Dari ALELEON by EFISON
(→‎1. Kategori Masalah: menyiapkan header)
(membuat section job pending)
 
Baris 1: Baris 1:
Laman ini membahas langkah troubleshooting dan kontak support ketika user menjumpai masalah selama pemakaian ALELEON Supercomputer.
Laman ini membahas langkah troubleshooting dan support ketika user menjumpai masalah selama pemakaian ALELEON Supercomputer.
 
* '''Silahkan pilih sesuai masalah yang dihadapi:'''
 
{| class="wikitable"
{| class="wikitable"
! colspan="2" |- Silahkan pilih kategori masalah berikut -
|-
|-
!Subbab
!Subbab
Baris 7: Baris 9:
|-
|-
!<big>[ 1 ]</big>
!<big>[ 1 ]</big>
|Masalah ketika menjalankan komputasi secara '''<big>batch job:</big>'''
|Masalah pada '''<big>batch job:</big>'''
* Job tidak mulai / gagal berjalan.
* Job tidak berjalan atau tertahan
* Job berjalan tidak sebagaimana mestinya
* Job berjalan tidak sebagaimana mestinya.
|-
|-
!<big>[ 2 ]</big>
!<big>[ 2 ]</big>
|Masalah ketika menjalankan '''sesi interaktif:'''
|Masalah pada '''<big>sesi interaktif</big>:'''
* Berlaku untuk '''<big>sesi Jupyter, ALELEON Desktop</big>'''
* Untuk '''sesi Jupyter, ALELEON Desktop'''
* Sesi tidak mulai / gagal berjalan.
* Sesi tidak mulai / gagal berjalan.
* Sesi berjalan tidak sebagaimana mestinya
* Sesi berjalan tidak sebagaimana mestinya.
|-
! colspan="2" |
|-
! colspan="2" |Bila masalah user belum ada di laman ini:
|-
| colspan="2" |Hubungi tim admin via '''<big>support@efisonlt.com</big>'''
|-
! colspan="2" |---
|}
|}


== '''''1. Masalah pada Batch Job''''' ==
== '''''1. Masalah pada Batch Job''''' ==
Dengan pembagian kategori:
{| class="wikitable"
![ 1.1 ]
|Job tidak berjalan atau tertahan
|-
![ 1.2 ]
|Job berjalan tidak sebagaimana mestinya.
|}
=== 1.1. Job Tidak Berjalan (state PENDING) ===
User dapat mencari '''alasan job yang tertahan''' melalui kode bernama '''<big>Reason</big>''':
* Kode Reason memberikan alasan manajemen Slurm menahan job.
{| class="wikitable"
! colspan="2" |- Langkah mencari kode Reason -
|-
!<big>User terminal</big>
!<big>User web EFIRO</big>
|-
! colspan="2" |<big><code>- / 1 / -</code></big>
|-
|Jalankan perintah:
$ '''squeue -lu $USER'''
* Cari job user yang '''<code>PENDING</code>'''.
* Kode Reason lihat kolom '''<code>NODELIST(REASON)</code>'''
|[[Berkas:Active Jobs detail.png|nirbing|400x400px]]
* Buka menu '''<code><big>Apps > Active Jobs</big></code>'''
* Di kanan atas, ubah opsi '''<code><big>All Jobs</big></code>''' ke '''<code><big>Your Jobs</big></code>'''
* Klik kotak <big>'''>'''</big> pada job status Pending
* Kode Reason ada pada kolom '''Reason'''.
|-
! colspan="2" |<big><code>- / 2 / -</code></big>
|-
|Penjelasan kode Reason lihat subbab '''<big>[ 3 ]</big>'''
|Penjelasan kode Reason lihat subbab '''<big>[ 3 ]</big>'''
|-
! colspan="2" |---
|}
=== 1.2. Job Berjalan Tidak Normal ===
Ketika job user berjalan tidak sebagaimana mestinya contoh terputus karena error:
* Terdapat dua kemungkinan penyebab masalah, dari sisi user dan ALELEON.
* Umumnya butuh kolaborasi user dan tim support.
{| class="wikitable"
! colspan="2" |- Kemungkinan penyebab masalah -
|-
!Sisi user
!Sisi ALELEON Supercomputer
|-
|
* Kesalahan mengisi submit script.
* Kesalahan pada file komputasi, ex:
** File tidak lengkap.
** File input salah.
* Kesalahan sintaks run job
|
* Kesalahan instalasi software.
* Kesalahan panduan komputasi.
* Masalah pada sistem ALELEON.
|}


== '''''2. Masalah pada Sesi Interaktif''''' ==
== '''''2. Masalah pada Sesi Interaktif''''' ==
== '''''3. Daftar Kode Reason ALELEON Supercomputer''''' ==

Revisi terkini sejak 6 Juli 2025 12.43

Laman ini membahas langkah troubleshooting dan support ketika user menjumpai masalah selama pemakaian ALELEON Supercomputer.

  • Silahkan pilih sesuai masalah yang dihadapi:
Subbab Kategori Masalah
[ 1 ] Masalah pada batch job:
  • Job tidak berjalan atau tertahan
  • Job berjalan tidak sebagaimana mestinya.
[ 2 ] Masalah pada sesi interaktif:
  • Untuk sesi Jupyter, ALELEON Desktop
  • Sesi tidak mulai / gagal berjalan.
  • Sesi berjalan tidak sebagaimana mestinya.
Bila masalah user belum ada di laman ini:
Hubungi tim admin via support@efisonlt.com
---

1. Masalah pada Batch Job

Dengan pembagian kategori:

[ 1.1 ] Job tidak berjalan atau tertahan
[ 1.2 ] Job berjalan tidak sebagaimana mestinya.

1.1. Job Tidak Berjalan (state PENDING)

User dapat mencari alasan job yang tertahan melalui kode bernama Reason:

  • Kode Reason memberikan alasan manajemen Slurm menahan job.
- Langkah mencari kode Reason -
User terminal User web EFIRO
- / 1 / -
Jalankan perintah:
$ squeue -lu $USER
  • Cari job user yang PENDING.
  • Kode Reason lihat kolom NODELIST(REASON)
Active Jobs detail.png
  • Buka menu Apps > Active Jobs
  • Di kanan atas, ubah opsi All Jobs ke Your Jobs
  • Klik kotak > pada job status Pending
  • Kode Reason ada pada kolom Reason.
- / 2 / -
Penjelasan kode Reason lihat subbab [ 3 ] Penjelasan kode Reason lihat subbab [ 3 ]
---

1.2. Job Berjalan Tidak Normal

Ketika job user berjalan tidak sebagaimana mestinya contoh terputus karena error:

  • Terdapat dua kemungkinan penyebab masalah, dari sisi user dan ALELEON.
  • Umumnya butuh kolaborasi user dan tim support.
- Kemungkinan penyebab masalah -
Sisi user Sisi ALELEON Supercomputer
  • Kesalahan mengisi submit script.
  • Kesalahan pada file komputasi, ex:
    • File tidak lengkap.
    • File input salah.
  • Kesalahan sintaks run job
  • Kesalahan instalasi software.
  • Kesalahan panduan komputasi.
  • Masalah pada sistem ALELEON.

2. Masalah pada Sesi Interaktif

3. Daftar Kode Reason ALELEON Supercomputer