Troubleshooting dan Support: Perbedaan antara revisi

Dari ALELEON by EFISON
(initial writing)
 
(membuat section job pending)
 
(1 revisi perantara oleh pengguna yang sama tidak ditampilkan)
Baris 1: Baris 1:
Laman ini membahas langkah troubleshooting dan kontak support ketika user menjumpai masalah selama pemakaian ALELEON Supercomputer.
Laman ini membahas langkah troubleshooting dan support ketika user menjumpai masalah selama pemakaian ALELEON Supercomputer.


== '''''1. Kategori Masalah''''' ==
* '''Silahkan pilih sesuai masalah yang dihadapi:'''
Silahkan pilih sesuai kategori berikut:
 
{| class="wikitable"
|-
!Subbab
!Kategori Masalah
|-
!<big>[ 1 ]</big>
|Masalah pada '''<big>batch job:</big>'''
* Job tidak berjalan atau tertahan
* Job berjalan tidak sebagaimana mestinya.
|-
!<big>[ 2 ]</big>
|Masalah pada '''<big>sesi interaktif</big>:'''
* Untuk '''sesi Jupyter, ALELEON Desktop'''
* Sesi tidak mulai / gagal berjalan.
* Sesi berjalan tidak sebagaimana mestinya.
|-
! colspan="2" |
|-
! colspan="2" |Bila masalah user belum ada di laman ini:
|-
| colspan="2" |Hubungi tim admin via '''<big>support@efisonlt.com</big>'''
|-
! colspan="2" |---
|}
 
== '''''1. Masalah pada Batch Job''''' ==
Dengan pembagian kategori:  
{| class="wikitable"
![ 1.1 ]
|Job tidak berjalan atau tertahan
|-
![ 1.2 ]
|Job berjalan tidak sebagaimana mestinya.
|}
 
=== 1.1. Job Tidak Berjalan (state PENDING) ===
User dapat mencari '''alasan job yang tertahan''' melalui kode bernama '''<big>Reason</big>''':
 
* Kode Reason memberikan alasan manajemen Slurm menahan job.
 
{| class="wikitable"
! colspan="2" |- Langkah mencari kode Reason -
|-
!<big>User terminal</big>
!<big>User web EFIRO</big>
|-
! colspan="2" |<big><code>- / 1 / -</code></big>
|-
|Jalankan perintah:
$ '''squeue -lu $USER'''
 
* Cari job user yang '''<code>PENDING</code>'''.
* Kode Reason lihat kolom '''<code>NODELIST(REASON)</code>'''
|[[Berkas:Active Jobs detail.png|nirbing|400x400px]]
 
* Buka menu '''<code><big>Apps > Active Jobs</big></code>'''
* Di kanan atas, ubah opsi '''<code><big>All Jobs</big></code>''' ke '''<code><big>Your Jobs</big></code>'''
* Klik kotak <big>'''>'''</big> pada job status Pending
* Kode Reason ada pada kolom '''Reason'''.
|-
! colspan="2" |<big><code>- / 2 / -</code></big>
|-
|Penjelasan kode Reason lihat subbab '''<big>[ 3 ]</big>'''
|Penjelasan kode Reason lihat subbab '''<big>[ 3 ]</big>'''
|-
! colspan="2" |---
|}
 
=== 1.2. Job Berjalan Tidak Normal ===
Ketika job user berjalan tidak sebagaimana mestinya contoh terputus karena error:
 
* Terdapat dua kemungkinan penyebab masalah, dari sisi user dan ALELEON.
* Umumnya butuh kolaborasi user dan tim support.
 
{| class="wikitable"
! colspan="2" |- Kemungkinan penyebab masalah -
|-
!Sisi user
!Sisi ALELEON Supercomputer
|-
|
* Kesalahan mengisi submit script.
* Kesalahan pada file komputasi, ex:
** File tidak lengkap.
** File input salah.
* Kesalahan sintaks run job
|
* Kesalahan instalasi software.
* Kesalahan panduan komputasi.
* Masalah pada sistem ALELEON.
|}
 
== '''''2. Masalah pada Sesi Interaktif''''' ==
 
== '''''3. Daftar Kode Reason ALELEON Supercomputer''''' ==

Revisi terkini sejak 6 Juli 2025 12.43

Laman ini membahas langkah troubleshooting dan support ketika user menjumpai masalah selama pemakaian ALELEON Supercomputer.

  • Silahkan pilih sesuai masalah yang dihadapi:
Subbab Kategori Masalah
[ 1 ] Masalah pada batch job:
  • Job tidak berjalan atau tertahan
  • Job berjalan tidak sebagaimana mestinya.
[ 2 ] Masalah pada sesi interaktif:
  • Untuk sesi Jupyter, ALELEON Desktop
  • Sesi tidak mulai / gagal berjalan.
  • Sesi berjalan tidak sebagaimana mestinya.
Bila masalah user belum ada di laman ini:
Hubungi tim admin via support@efisonlt.com
---

1. Masalah pada Batch Job

Dengan pembagian kategori:

[ 1.1 ] Job tidak berjalan atau tertahan
[ 1.2 ] Job berjalan tidak sebagaimana mestinya.

1.1. Job Tidak Berjalan (state PENDING)

User dapat mencari alasan job yang tertahan melalui kode bernama Reason:

  • Kode Reason memberikan alasan manajemen Slurm menahan job.
- Langkah mencari kode Reason -
User terminal User web EFIRO
- / 1 / -
Jalankan perintah:
$ squeue -lu $USER
  • Cari job user yang PENDING.
  • Kode Reason lihat kolom NODELIST(REASON)
Active Jobs detail.png
  • Buka menu Apps > Active Jobs
  • Di kanan atas, ubah opsi All Jobs ke Your Jobs
  • Klik kotak > pada job status Pending
  • Kode Reason ada pada kolom Reason.
- / 2 / -
Penjelasan kode Reason lihat subbab [ 3 ] Penjelasan kode Reason lihat subbab [ 3 ]
---

1.2. Job Berjalan Tidak Normal

Ketika job user berjalan tidak sebagaimana mestinya contoh terputus karena error:

  • Terdapat dua kemungkinan penyebab masalah, dari sisi user dan ALELEON.
  • Umumnya butuh kolaborasi user dan tim support.
- Kemungkinan penyebab masalah -
Sisi user Sisi ALELEON Supercomputer
  • Kesalahan mengisi submit script.
  • Kesalahan pada file komputasi, ex:
    • File tidak lengkap.
    • File input salah.
  • Kesalahan sintaks run job
  • Kesalahan instalasi software.
  • Kesalahan panduan komputasi.
  • Masalah pada sistem ALELEON.

2. Masalah pada Sesi Interaktif

3. Daftar Kode Reason ALELEON Supercomputer