PHASE/0: Perbedaan antara revisi

Dari ALELEON by EFISON
(paraphrasing)
(→‎Job Submission Web EFIRO: mengganti gambar submit)
 
(37 revisi perantara oleh 2 pengguna tidak ditampilkan)
Baris 1: Baris 1:
=='''Deskripsi'''==
[[Berkas:Phase-logo4.png|nirbing|200x200px]]
[https://www.nwchem-sw.org/ '''PHASE/0'''] adalah program untuk menghitung struktur elektronik yang berbasis DFT (density functional theory) dan skema pseudopotensial. Program ini dapat memperkirakan ciri fisik dari material yang tidak ditemukan dalam percobaan apapun dengan ketepatan tinggi.
 
=='''Versi yang Tersedia'''==
'''[https://azuma.nims.go.jp/ PHASE/0]''' adalah program untuk menghitung struktur elektronik yang berbasis DFT (density functional theory) dan skema pseudopotensial. Program ini dapat memperkirakan ciri fisik dari material yang tidak ditemukan dalam percobaan apapun dengan ketepatan tinggi.
=='''Modul PHASE/0'''==
Berikut adalah detail versi PHASE/0 yang tersedia secara global di ALELEON Supercomputer:
{| class="wikitable"
{| class="wikitable"
!Versi
|+Modul PHASE/0 untuk phase
!Nama Modul
! rowspan="2" |Versi
!Dukungan MPI
! rowspan="2" |Nama modul software
!Dukungan Hardware
! colspan="4" |Dukungan hardware
![[Partisi Aleleon Mk.II|Partisi]]
|-
|-
|2020.01
!CPU
|phase0
!GPU
|Pure MPI
!OMP
|CPU, parallel multi-node
Threading
|epyc
!MPI
multi-node
|-
|2023.01
|phase0/2023.01.01-3D-OneAPI
|V
| -
| -
|V
|}
=='''Pilihan Menjalankan Komputasi'''==
User dapat memilih metode menjalankan komputasi sesuai keinginan:
 
* '''Job submission terminal'''
** ''Berjalan di [[Spesifikasi ALELEON Supercomputer#Spesifikasi%20Compute%20Node|compute node]] melalui manajemen Slurm.''
* '''Job submission web EFIRO'''
** ''Berjalan di [[Spesifikasi ALELEON Supercomputer#Spesifikasi%20Compute%20Node|compute node]] melalui manajemen Slurm via web EFIRO.''
 
===Job Submission Terminal===
{| class="wikitable mw-collapsible mw-collapsed"
!Langkah Job Submission Terminal
[[Berkas:Sbatch Terminal.png|tepi|400x400px]]
|-
!1
|-
| Lakukan [https: / wiki.efisonlt.com wiki Menggunakan_ALELEON_Supercomputer_via_Terminal#1_ |'''[https://wiki.efisonlt.com/wiki/Menggunakan_ALELEON_Supercomputer_via_Terminal#Login_SSH Login SSH]''' ke ALELEON Supercomputer.
|-
!2
|-
|Siapkan file komputasi yang dibutuhkan.
*User dapat upload / download file dengan [[Upload File dengan Aplikasi FTP|'''software FTP''']].
|-
!3A
|-
| Buat '''Submit Script''' yaitu 'formulir' untuk menjalankan job komputasi.
*Nama file bebas dengan format .sh, contoh '''<code>submit.sh</code>'''
|-
!
|-
|Contoh template Submit Script, ikuti petunjuk NOTES didalamnya.
* ''<small>Klik expand / kembangkan</small>''
{| class="wikitable mw-collapsible mw-collapsed"
!Template Submit Script PHASE/0 versi phase
|-
|<syntaxhighlight lang="bash" line="1">
#!/bin/bash
 
# -----------------------------------------------------
# Template SLURM Submit Script
# PHASE/0 | rev.080124
#
# NOTES:
# 1. Isi bagian yang ditandai 4 garing (////).
# 2. Template ini bersifat referensi.
#    User dapat mengubah bagian yang perlu diubah.
# -----------------------------------------------------
 
# -----------------------------------------------------
# Alokasi komputasi SBATCH, input, dan module
# -----------------------------------------------------
 
# Alokasi jumlah core thread CPU
#SBATCH --ntasks=////
 
# Alokasi jumlah memori RAM (satuan GB)
#SBATCH --mem=////GB
 
# Alokasi limit waktu menjalankan job
# Format HH:MM:SS atau D-HH:MM:SS
#SBATCH --time=////
 
# Definisi file untuk menampung output terminal program
#SBATCH --output=result-%j.txt
 
# Definisi file untuk menampung output error log   
#SBATCH --error=error-%j.txt
 
# Memuat modul software PHASE/0
# Daftar modul lihat subbab "Modul PHASE/0" di atas
module load phase0////
 
# ----------------------------------------------------
# Script jalannya program
# ----------------------------------------------------
 
# Perintah menjakankan PHASE/0
mpirun -np ${SLURM_NTASKS} phase
</syntaxhighlight>
|}
|}
=='''Contoh SLURM Script'''==
{| class="wikitable mw-collapsible mw-collapsed"
User harus menggunakan [[Scheduler SLURM Aleleon|'''manajemen SLURM''']] untuk menjalankan komputasi PHASE/0 di Compute Node. User dapat menjalankan PHASE/0 dengan satu node atau multi node (lebih dari satu node) untuk performa lebih.
!Template Submit Script PHASE/0 versi ekcal
==='''Satu Node CPU'''===
|-
Contoh berikut untuk menjalankan PHASE/0 pada satu node CPU.
|<syntaxhighlight lang="bash" line="1">
  #!/bin/bash
#!/bin/bash
 
# -----------------------------------------------------
# Template SLURM Submit Script
# PHASE/0 ekcal | rev.080124
#
# NOTES:
# 1. Isi bagian yang ditandai 4 garing (////).
# 2. Template ini bersifat referensi.
#    User dapat mengubah bagian yang perlu diubah.
# -----------------------------------------------------
 
# -----------------------------------------------------
# Alokasi komputasi SBATCH, input, dan module
# -----------------------------------------------------
 
# Alokasi jumlah core thread CPU
#SBATCH --ntasks=////
 
# Alokasi jumlah memori RAM (satuan GB)
#SBATCH --mem=////GB
 
# Alokasi limit waktu menjalankan job
# Format HH:MM:SS atau D-HH:MM:SS
#SBATCH --time=////
 
# Definisi file untuk menampung output terminal program
#SBATCH --output=result-%j.txt
 
# Definisi file untuk menampung output error log   
#SBATCH --error=error-%j.txt
 
# Memuat modul software PHASE/0
# Daftar modul lihat subbab "Modul PHASE/0" di atas
module load phase0////
 
# ----------------------------------------------------
# Script jalannya program
# ----------------------------------------------------
 
# Perintah menjakankan PHASE/0
mpirun -np ${SLURM_NTASKS} ekcal
</syntaxhighlight>
|}
|-
|
*''Info script lebih detail lihat [[Submit Script ALELEON Supercomputer|'''Submit Script ALELEON Supercomputer''']].''
*''Untuk SBATCH notifikasi email status jalannya job lihat [https://wiki.efisonlt.com/wiki/Submit_Script_ALELEON_Supercomputer#SBATCH_untuk_notifikasi_email_SLURM '''Slurm Jojo'''].''
|-
!3B
|-
| '''SBATCH komputasi (ntasks, mem, time, dll) mempunyai limit''' berdasarkan:
 
* Sisa Core Hour user dan [[Limitasi Fair Usage ALELEON Supercomputer|'''Fair Usage Limit''']].
*Spesifikasi sistem dan software komputasi.
Untuk melihat limit, jalankan perintah berikut:
  '''$ slimit-mpi'''
|-
!4
|-
|Jalankan job komputasi dengan perintah:
$ '''sbatch ''[nama-submit-script]'''''
   
   
  #SBATCH --ntasks=64              # Contoh menggunakan 64 core CPU
  ''Contoh:''
#SBATCH --mem=128GB              # Contoh menggunakan RAM 128GB
$ sbatch submit.sh
#SBATCH --time=10:00:00          # Contoh menetapkan walltime maks 10 jam
|-
#SBATCH --output=result-%j.out    # Output terminal program
! 5
#SBATCH --error=result-%j.err    # Output verbose program
|-
|User dapat melihat status jalannya job dengan perintah:
'''<code>$ squeue -ul $USER</code>'''
 
Kolom ST atau STATE menunjukkan status jalannya job.
{| class="wikitable"
! colspan="2" |''Kolom ST atau STATE menunjukkan status jalannya job.''
|-
! STATE
!Penjelasan
|-
|R (RUN)
|Job berjalan
|-
|PD (PENDING)
|Job tertahan, lihat [[Daftar Reason NODELIST ALELEON Supercomputer|'''NODELIST(REASON)''']]
|-
|CG (COMPLETING)
|Job selesai dan dalam proses clean-up
|-
|CA (CANCELED)
|Job dibatalkan user
|-
|PR (PREEMPETED)
| Job dibatalkan admin, alasan dikabarkan via email
|-
|S (SUSPENDED)
|Job ditahan admin, alasan dikabarkan via email
|}
|-
!
|-
|Apabila user ingin menghentikan job yang berjalan, jalankan perintah:
'''$ scancel ''[job-ID]'''''
   
   
  # Memuat modul PHASE/0
  ''Job ID ada pada squeue diatas.''
  '''module load phase0'''
contoh membatalkan job ID 231:
$ scancel 231
# RUN COMMAND
|}
# mpirun wajib menggunakan flag protokol UCX
 
=== Job Submission Web EFIRO ===
'''mpirun -np $SLURM_NTASKS --mca pml ucx --mca osc ucx phase'''
{| class="wikitable mw-collapsible mw-collapsed"
==='''Multi Node CPU'''===
!Langkah Job Submission Web EFIRO
Contoh berikut untuk menjalankan PHASE/0 pada lebih dari satu node CPU.
[[Berkas:Efirojobcomposer3.png|nirbing|400x400px]]
#!/bin/bash
|-
   
!1
#SBATCH --nodes=2                # Contoh menggunakan 2 node ...
|-
  #SBATCH --ntasks-per-node=128    # dengan 128 core per node.
| [https: / wiki.efisonlt.com wiki Menggunakan_ALELEON_Supercomputer_via_EFIRO#1_ |'''[https://wiki.efisonlt.com/wiki/Menggunakan_ALELEON_Supercomputer_via_EFIRO#Login_Web_EFIRO Login ke web EFIRO]''' ALELEON Supercomputer.
                                  # Maka dari itu total menggunakan 256 core CPU
|-
#SBATCH --mem=128GB              # Contoh menggunakan RAM 128GB per node
!2
#SBATCH --time=10:00:00          # Contoh menggunakan walltime maks 10 jam
|-
#SBATCH --output=result-%j.out    # Output terminal program
|[[Berkas:New Pinnedapps jc.png|nirbing|128x128px]]Buka pinned apps '''Job Composer''' di homepage EFIRO.
#SBATCH --error=result-%j.err    # Output verbose program
Pilih menu '''<code>New Job</code>''' -> '''<code>From Template</code>'''
 
# Memuat modul PHASE/0
[[Berkas:Jcnewjobmarked.png|nirbing|180x180px]]
'''module load phase0'''
|-
!3
# RUN COMMAND
|-
# mpirun wajib menggunakan flag protokol UCX
|
# $SLURM_NTASKS menangkap total proses MPI (nodes * ntasks-per-node)
{| class="wikitable"
! colspan="2" |Pilih template PHASE/0 yang diinginkan:
'''mpirun -np $SLURM_NTASKS --mca pml ucx --mca osc ucx phase'''
|-
==='''Pelajari Lebih Lanjut'''===
!Nama Template
Pengguna dapat melihat laman [https://wiki.efisonlt.com/wiki/Contoh_SLURM_Script#SLURM_Script_untuk_Komputasi_Paralel_MPI '''SLURM Script untuk Komputasi Paralel MPI'''] untuk memahami lebih lanjut tentang berbagai contoh SLURM script diatas,
!Penjelasan
|-
|PHASE/0 2023.01
|Menjalankan PHASE/0 2023.01
|-
|PHASE/0 2023.01 ekcal
|Menjalankan PHASE/0 2023.01 dengan ekcal
|}Kemudian Isi '''<code>Job Name</code>''' dan klik '''<code>Create New Job</code>'''
 
[[Berkas:Jctemplate-2.png|nirbing]]
|-
! 4
|-
|Siapkan file komputasi yang dibutuhkan:
*Upload / download / edit file via menu <code>'''Edit Files'''</code>
**Untuk upload file tunggal diatas 2GB gunakan [[Upload File dengan Aplikasi FTP|'''software FTP''']].
[[Berkas:JC job menu.png|nirbing|500x500px]]
|-
!5A
|-
|Lengkapi '''Submit Script''' melalui tombol '''<code>Open Editor</code>'''.
[[Berkas:Jceditor3.png|al=|nirbing|400x400px]]
*Submit script adalah 'formulir' untuk menjalankan job komputasi.
*Ikuti petunjuk NOTES didalamnya
*Klik '''<code>Save</code>''' setiap kali mengubah script.
|-
|
*''<small>Info script lebih detail lihat [[Submit Script ALELEON Supercomputer|'''Submit Script ALELEON Supercomputer''']].</small>''
*''<small>Untuk SBATCH notifikasi email status jalannya job lihat [https://wiki.efisonlt.com/wiki/Submit_Script_ALELEON_Supercomputer#SBATCH_untuk_notifikasi_email_SLURM '''Slurm Jojo'''].</small>''  
|-
!5B
|-
|'''SBATCH komputasi (ntasks, mem, time, dll) mempunyai limit''' berdasarkan:
* Sisa Core Hour user dan [[Limitasi Fair Usage ALELEON Supercomputer|'''Fair Usage Limit''']].
*Spesifikasi sistem dan software komputasi.
Untuk melihat limit, jalankan perintah berikut pada terminal:
  '''$ slimit-mpi'''
|-
!6
|-
|Jalankan job dengan klik tombol '''<code>Submit</code>'''.
*Pantau kolom status yang menjelaskan status jalannya job.
*Apabila ingin membatalkan job yang berjalan, klik '''<code>Stop</code>'''.
*Job completed dapat dijalankan kembali dengan '''<code>Submit</code>'''.
[[Berkas:JC job runstop.png|al=|nirbing|500x500px]]
{| class="wikitable"
! colspan="2" |Daftar status job
|-
!Status
!Arti
|-
|Not Submitted
|Job belum pernah dijalankan.
|-
|Running
| Job berjalan.
|-
|Queue
|Job mengantri dan belum berjalan.
|-
|Completed
| Job selesai berjalan.
|-
| Failed
|Job berhenti karena error atau di stop user.
|-
| colspan="2" | '''''Untuk melihat alasan job yang queue:'''''[[Berkas:Active Jobs detail.png|nir|jmpl|300x300px|''Buka pinned apps '''Active Jobs''' di homepage EFIRO. Ubah opsi All jobs ke '''Your Jobs'''. Klik simbol '''>''' untuk melihat status job yang pending pada kolom Reason. Arti reason lihat laman [[Daftar Reason NODELIST ALELEON Supercomputer|'''Daftar Reason NODELIST ALELEON Supercomputer''']].'']]
|}
|-
!7
|-
|Lihat output file komputasi pada kolom '''<code>Folder Contents</code>'''
*Atau dengan membuka '''<code>Edit Files</code>'''
[[Berkas:Jcfoldercontentsedit.png|al=|nir|jmpl|''Kolom '''<code>Folder Contents</code>'''.'']]
|-
!8
|-
|Untuk menghapus ruang job dan datanya:
*Pilih ruang job yang akan dihapus.
*Klik menu '''<code>Delete</code>'''
[[Berkas:JC delete menu.png|nirbing|500x500px]]
|}
 
=='''Pelaporan Kendala dan Support'''==
Apabila menjumpai masalah teknis dalam menjalankan komputasi, silahkan lapor dengan klik gambar berikut ini.
 
[[Berkas:Wiki-pelaporankendala.jpg|1000x1000px|link=https://efisonlt.com/aleleonbugreport]]
 
---
 
Bila terdapat pertanyaan lainnya, silahkan hubungi admin EFISON melalui email:
'''support@efisonlt.com'''

Revisi terkini sejak 22 Juli 2024 08.57

Phase-logo4.png

PHASE/0 adalah program untuk menghitung struktur elektronik yang berbasis DFT (density functional theory) dan skema pseudopotensial. Program ini dapat memperkirakan ciri fisik dari material yang tidak ditemukan dalam percobaan apapun dengan ketepatan tinggi.

Modul PHASE/0

Berikut adalah detail versi PHASE/0 yang tersedia secara global di ALELEON Supercomputer:

Modul PHASE/0 untuk phase
Versi Nama modul software Dukungan hardware
CPU GPU OMP

Threading

MPI

multi-node

2023.01 phase0/2023.01.01-3D-OneAPI V - - V

Pilihan Menjalankan Komputasi

User dapat memilih metode menjalankan komputasi sesuai keinginan:

  • Job submission terminal
  • Job submission web EFIRO
    • Berjalan di compute node melalui manajemen Slurm via web EFIRO.

Job Submission Terminal

Langkah Job Submission Terminal

Sbatch Terminal.png

1
Login SSH ke ALELEON Supercomputer.
2
Siapkan file komputasi yang dibutuhkan.
3A
Buat Submit Script yaitu 'formulir' untuk menjalankan job komputasi.
  • Nama file bebas dengan format .sh, contoh submit.sh
Contoh template Submit Script, ikuti petunjuk NOTES didalamnya.
  • Klik expand / kembangkan
Template Submit Script PHASE/0 versi phase
#!/bin/bash

# -----------------------------------------------------
# Template SLURM Submit Script
# PHASE/0 | rev.080124
# 
# NOTES: 
# 1. Isi bagian yang ditandai 4 garing (////).
# 2. Template ini bersifat referensi.
#    User dapat mengubah bagian yang perlu diubah.
# -----------------------------------------------------

# -----------------------------------------------------
# Alokasi komputasi SBATCH, input, dan module
# -----------------------------------------------------

# Alokasi jumlah core thread CPU
#SBATCH --ntasks=////

# Alokasi jumlah memori RAM (satuan GB)
#SBATCH --mem=////GB

# Alokasi limit waktu menjalankan job
# Format HH:MM:SS atau D-HH:MM:SS
#SBATCH --time=////

# Definisi file untuk menampung output terminal program
#SBATCH --output=result-%j.txt

# Definisi file untuk menampung output error log    
#SBATCH --error=error-%j.txt 

# Memuat modul software PHASE/0
# Daftar modul lihat subbab "Modul PHASE/0" di atas 
module load phase0////

# ----------------------------------------------------
# Script jalannya program
# ----------------------------------------------------

# Perintah menjakankan PHASE/0
mpirun -np ${SLURM_NTASKS} phase
Template Submit Script PHASE/0 versi ekcal
#!/bin/bash

# -----------------------------------------------------
# Template SLURM Submit Script
# PHASE/0 ekcal | rev.080124
# 
# NOTES: 
# 1. Isi bagian yang ditandai 4 garing (////).
# 2. Template ini bersifat referensi.
#    User dapat mengubah bagian yang perlu diubah.
# -----------------------------------------------------

# -----------------------------------------------------
# Alokasi komputasi SBATCH, input, dan module
# -----------------------------------------------------

# Alokasi jumlah core thread CPU
#SBATCH --ntasks=////

# Alokasi jumlah memori RAM (satuan GB)
#SBATCH --mem=////GB

# Alokasi limit waktu menjalankan job
# Format HH:MM:SS atau D-HH:MM:SS
#SBATCH --time=////

# Definisi file untuk menampung output terminal program
#SBATCH --output=result-%j.txt

# Definisi file untuk menampung output error log    
#SBATCH --error=error-%j.txt 

# Memuat modul software PHASE/0
# Daftar modul lihat subbab "Modul PHASE/0" di atas 
module load phase0////

# ----------------------------------------------------
# Script jalannya program
# ----------------------------------------------------

# Perintah menjakankan PHASE/0
mpirun -np ${SLURM_NTASKS} ekcal
3B
SBATCH komputasi (ntasks, mem, time, dll) mempunyai limit berdasarkan:
  • Sisa Core Hour user dan Fair Usage Limit.
  • Spesifikasi sistem dan software komputasi.

Untuk melihat limit, jalankan perintah berikut:

$ slimit-mpi 
4
Jalankan job komputasi dengan perintah:
$ sbatch [nama-submit-script]

Contoh:
$ sbatch submit.sh
5
User dapat melihat status jalannya job dengan perintah:

$ squeue -ul $USER

Kolom ST atau STATE menunjukkan status jalannya job.

Kolom ST atau STATE menunjukkan status jalannya job.
STATE Penjelasan
R (RUN) Job berjalan
PD (PENDING) Job tertahan, lihat NODELIST(REASON)
CG (COMPLETING) Job selesai dan dalam proses clean-up
CA (CANCELED) Job dibatalkan user
PR (PREEMPETED) Job dibatalkan admin, alasan dikabarkan via email
S (SUSPENDED) Job ditahan admin, alasan dikabarkan via email
Apabila user ingin menghentikan job yang berjalan, jalankan perintah:
$ scancel [job-ID]

Job ID ada pada squeue diatas.
contoh membatalkan job ID 231:
$ scancel 231

Job Submission Web EFIRO

Langkah Job Submission Web EFIRO

Efirojobcomposer3.png

1
Login ke web EFIRO ALELEON Supercomputer.
2
New Pinnedapps jc.pngBuka pinned apps Job Composer di homepage EFIRO.

Pilih menu New Job -> From Template

Jcnewjobmarked.png

3
Pilih template PHASE/0 yang diinginkan:
Nama Template Penjelasan
PHASE/0 2023.01 Menjalankan PHASE/0 2023.01
PHASE/0 2023.01 ekcal Menjalankan PHASE/0 2023.01 dengan ekcal
Kemudian Isi Job Name dan klik Create New Job

Jctemplate-2.png

4
Siapkan file komputasi yang dibutuhkan:
  • Upload / download / edit file via menu Edit Files

JC job menu.png

5A
Lengkapi Submit Script melalui tombol Open Editor.

  • Submit script adalah 'formulir' untuk menjalankan job komputasi.
  • Ikuti petunjuk NOTES didalamnya
  • Klik Save setiap kali mengubah script.
5B
SBATCH komputasi (ntasks, mem, time, dll) mempunyai limit berdasarkan:
  • Sisa Core Hour user dan Fair Usage Limit.
  • Spesifikasi sistem dan software komputasi.

Untuk melihat limit, jalankan perintah berikut pada terminal:

$ slimit-mpi
6
Jalankan job dengan klik tombol Submit.
  • Pantau kolom status yang menjelaskan status jalannya job.
  • Apabila ingin membatalkan job yang berjalan, klik Stop.
  • Job completed dapat dijalankan kembali dengan Submit.

Daftar status job
Status Arti
Not Submitted Job belum pernah dijalankan.
Running Job berjalan.
Queue Job mengantri dan belum berjalan.
Completed Job selesai berjalan.
Failed Job berhenti karena error atau di stop user.
Untuk melihat alasan job yang queue:
Buka pinned apps Active Jobs di homepage EFIRO. Ubah opsi All jobs ke Your Jobs. Klik simbol > untuk melihat status job yang pending pada kolom Reason. Arti reason lihat laman Daftar Reason NODELIST ALELEON Supercomputer.
7
Lihat output file komputasi pada kolom Folder Contents
  • Atau dengan membuka Edit Files
Kolom Folder Contents.
8
Untuk menghapus ruang job dan datanya:
  • Pilih ruang job yang akan dihapus.
  • Klik menu Delete

JC delete menu.png

Pelaporan Kendala dan Support

Apabila menjumpai masalah teknis dalam menjalankan komputasi, silahkan lapor dengan klik gambar berikut ini.

Wiki-pelaporankendala.jpg

---

Bila terdapat pertanyaan lainnya, silahkan hubungi admin EFISON melalui email:

support@efisonlt.com