Quantum ESPRESSO: Perbedaan antara revisi

Dari ALELEON by EFISON
(test writing)
(overhaul wiki QE 120124)
 
(5 revisi perantara oleh pengguna yang sama tidak ditampilkan)
Baris 2: Baris 2:


[https://www.quantum-espresso.org/ '''Quantum ESPRESSO'''] adalah framework suite untuk kalkulasi ''electronic-structure'' dan modeling material berdasarkan ''density-functional theory'' (DFT)'', plane waves'', dan ''pseudopotentials''.
[https://www.quantum-espresso.org/ '''Quantum ESPRESSO'''] adalah framework suite untuk kalkulasi ''electronic-structure'' dan modeling material berdasarkan ''density-functional theory'' (DFT)'', plane waves'', dan ''pseudopotentials''.
 
=='''Modul Quantum ESPRESSO'''==
== '''Versi yang Tersedia''' ==
Berikut adalah detail versi Quantum ESPRESSO yang tersedia secara global di ALELEON Supercomputer:
{| class="wikitable"
{| class="wikitable"
!Versi
|+Modul Quantum ESPRESSO
!Dukungan MPI
! rowspan="2" |Versi
!Dukungan Hardware
! rowspan="2" |Nama modul
! colspan="4" |Dukungan hardware
|-
|-
|6.7
!CPU
|Pure MPI
!GPU
|CPU, multi-node
!OMP
Threading
!MPI
multi-node
|-
|6.7  
|qe/6.7-GCC10-MKL-LibM
|V
| -
| -
|V
|-
|-
|6.8
|6.8
|Pure MPI
|qe/6.8-GCC10-MKL-LibM
|CPU, multi-node
|V
| -
| -
| V
|-
|7.1
|qe/7.1-GCC11.3-AOCL4.0-ELPA2022.05-Libxc6.1.0
|V
| -
| -
|V
|}
|}


== '''Menjalankan Quantum ESPRESSO di Job Composer''' ==
== '''Info Perubahan Menjalankan Quantum ESPRESSO di ALELEON''' ==
User menjalankan Quantum ESPRESSO pada '''Job Composer''' EFIRO yang dapat dibuka melalui menu Jobs > Jobs Composer
Terdapat perubahan sintaks MPI untuk menjalankan Quantum ESPRESSO berdasarkan update scheduler SLURM ALELEON Supercomputer pada maintenance 7-12 Januari 2024 yaitu:
 
* Menggunakan mpirun biasa untuk menjalankan QE satu node.
* Menggunakan mpirun dengan sintaks UCX untuk menjalankan QE multi-node
 
'''Perubahan ini telah diupdate pada tutorial template SLURM Submit Script dan Template Job Composer untuk Quantum ESPRESSO dengan skema sintaks MPI berikut:'''<syntaxhighlight lang="bash" line="1">
...
 
if [ $SLURM_NNODES -eq 1 ]
then
echo "Terdeteksi running QE dengan 1 node"
mpirun -np ${SLURM_NTASKS} pw.x -input ${INPUT_FILE}
elif [ $SLURM_NNODES -gt 1 ]
then
echo "Terdeteksi running QE dengan ${SLURM_NNODES} node"
mpirun -np ${SLURM_NTASKS} --mca pml ucx --mca osc ucx pw.x -input ${INPUT_FILE}
fi
</syntaxhighlight>
 
=='''Menjalankan Quantum ESPRESSO'''==
User dapat menjalankan komputasi dengan pilihan cara melalui terminal atau website EFIRO ''(klik expand atau kembangkan)''.
===Opsi Menggunakan terminal (SLURM sbatch)===
{| class="wikitable mw-collapsible mw-collapsed"
! colspan="2" |Langkah Menjalankan Quantum ESPRESSO di Terminal
[[Berkas:Sbatch Terminal.png|nirbing|500x500px]]
|-
|'''0'''
|
=====Login SSH=====
Tatacara login SSH lihat laman [https://wiki.efisonlt.com/wiki/Menggunakan_ALELEON_Supercomputer_via_Terminal#1_|_Login_SSH '''Login SSH ALELEON Supercomputer'''].
|-
|'''1'''
|
=====Menyiapkan File Komputasi=====
Siapkan file yang dibutuhkan untuk komputasi user, rekomendasi dalam satu folder per job:
*File input dan data komputasi.
**User dapat upload / download file ke ALELEON dengan [[Upload File dengan Aplikasi FTP|'''software FTP''']].
*Membuat '''SLURM Submit Script''' yaitu 'formulir' untuk menjalankan job komputasi.
**Nama script bebas dengan format file .sh (bash), contoh ''<code>my_job_submission.sh</code>''
$ mkdir kerjaanskripsi
$ cd kerjaanskripsi
$ nano my_job_submission.sh
''... upload / menyiapkan / edit input dan data komputasi ...''
|-
| rowspan="2" |'''2'''
|
=====Template SLURM Submit Script Quantum ESPRESSO=====
Ikuti panduan template berikut dan petunjuk NOTES di dalamnya.
{| class="wikitable mw-collapsible mw-collapsed"
!Template SLURM Submit Script untuk Quantum ESPRESSO versi CPU
|-
|<syntaxhighlight lang="bash" line="1">
#!/bin/bash
 
# -----------------------------------------------------
# Template SLURM Submit Script
# Quantum ESPRESSO | rev.080124
#
# NOTES:
# 1. Isi bagian yang ditandai 4 garing (////).
# 2. Template ini bersifat referensi.
#    User dapat mengubah bagian yang perlu diubah.
# -----------------------------------------------------
 
# -----------------------------------------------------
# Alokasi komputasi SBATCH, input, dan module
# -----------------------------------------------------
 
# Alokasi jumlah core thread CPU
#SBATCH --ntasks=////
 
# Alokasi jumlah memori RAM (satuan GB)
#SBATCH --mem=////GB
 
# Alokasi limit waktu menjalankan job
# Format HH:MM:SS atau D-HH:MM:SS
#SBATCH --time=////
 
# Definisi file untuk menampung output terminal program
#SBATCH --output=result-%j.txt
 
# Definisi file untuk menampung output error log   
#SBATCH --error=error-%j.txt
 
# Nama input file Quantum ESPRESSO yang dijalankan
INPUT_FILE="////.in"


[[Berkas:Efirojobcomposermenu.png|nirbing|400x400px]]
# Memuat modul software Quantum ESPRESSO
# Daftar modul lihat subbab "Modul Quantum ESPRESSO" di atas
module load qe////


== '''Memilih template Quantum ESPRESSO'''==
# ----------------------------------------------------
# Script jalannya program
# ----------------------------------------------------
 
# Perintah menjakankan Quantum ESPERESSO
# Kondisi khusus dimana 1 node -> mpirun tanpa UCX
# 2 node -> mpirun dengan UCX
 
if [ $SLURM_NNODES -eq 1 ]
then
echo "Terdeteksi running QE dengan 1 node"
mpirun -np ${SLURM_NTASKS} pw.x -input ${INPUT_FILE}
elif [ $SLURM_NNODES -gt 1 ]
then
echo "Terdeteksi running QE dengan 2 node"
mpirun -np ${SLURM_NTASKS} --mca pml ucx --mca osc ucx pw.x -input ${INPUT_FILE}
fi
</syntaxhighlight>
|}
|-
|
=====Panduan Nilai Maksimal SBATCH untuk Quantum ESPRESSO=====
{| class="wikitable mw-collapsible mw-collapsed"
! colspan="5" |Panduan Nilai Maksimal SBATCH ntasks, mem, gpus, time
|-
!Skenario Komputasi
!ntasks
(CPU)
!mem
(RAM)
!gpus
(GPU)
!time
(time limit)
|-
|Fair policy usage untuk akumulasi semua job<sup>''1''</sup>
|128
|128GB
|2
| rowspan="3" |3-00:00:00
atau
 
72:00:00
|-
|Quantum ESPRESSO''<sup>2</sup>''
|384
|240GB''<sup>2</sup>''
|0
|-
|Quantum ESPRESSO di high-mem node
*Tambahkan <code>#SBATCH --nodelist=epyc001</code>
|128
|500GB
|0
|-
| colspan="5" |'''''Keterangan:'''''
#Limitasi untuk menjaga kualitas layanan ALELEON Supercomputer.
#*User dapat mengajukan permintaan buka limitasi apabila butuh alokasi lebih.
#*Info detail buka laman [[Limitasi Fair Usage ALELEON Supercomputer|'''Limitasi Fair Usage ALELEON Supercomputer''']]
#QE mendukung komputasi paralel MPI. Ketika jumlah ntasks lebih dari 128:
#*SLURM otomatis menjalankan job pada multi-node.
#*Parameter mem adalah alokasi memori RAM per-node.
#*Info detail buka laman [[MPI ALELEON Supercomputer|'''MPI ALELEON Supercomputer''']].
|-
! colspan="5" |Keterangan tambahan
|-
| colspan="5" |
*'''Untuk akun perseorangan dengan Kredit Core Hour:'''
**SLURM akan menahan job apabila:
***ntasks * time (jam) lebih besar dari sisa CPU Core Hour user.
***gpus * time (jam) lebih besar dari sisa GPU Hour user.
**Cek sisa Kredit Core Hour melalui perintah:
$ '''sausage'''
*Info SBATCH lebih detail lihat laman [[Submit Script ALELEON Supercomputer|'''Submit Script ALELEON Supercomputer''']]
|}
|-
|'''3'''
|
=====Menjalankan Job Komputasi=====
Jalankan job dengan perintah sbatch.
$ '''sbatch''' '''''<nama-SLURM-Submit-script>'''''
Contoh menjalankan nama script <code>my_job_submission.sh</code>.
$ sbatch my_job_submission.sh
|-
|'''4A'''
|User dapat melihat status jalannya job dengan perintah squeue berikut.
*Apabila tidak ada output artinya tidak ada job user yang berjalan / antri pada waktu itu.
$ '''squeue -ul $USER'''
Berikut adalah daftar STATE (ST) dari squeue yang menunjukkan status berjalannya job:
{| class="wikitable"
{| class="wikitable"
|+Template Quantum ESPRESSO yang tersedia
|+Daftar STATE squeue SLURM
! Nama Template
!STATE
!Kepanjangan
!Penjelasan
|-
|R
|RUN
|Job berjalan
|-
|PD
|PENDING
|Job tertahan, lihat keterangan [[Daftar Reason NODELIST ALELEON Supercomputer|'''NODELIST(REASON)''']]
|-
|CG
|COMPLETING
|Job selesai dan dalam proses clean-up SLURM
|-
|CA
|CANCELED
|Job dibatalkan oleh user
|-
|PR
|PREEMPETED
|Job dibatalkan oleh admin EFISON, alasan dikabarkan melalui email
|-
|S
|SUSPENDED
|Job ditahan oleh admin EFISON
|}
|-
|'''4B'''
|
=====Menghentikan Job Komputasi=====
Apabila user ingin membatalkan job, gunakan perintah scancel berdasarkan job ID.
*Job ID dapat dilihat melalui perintah squeue pada kolom JOBID.
*User hanya bisa membatalkan job submission milik user sendiri.
$ '''scancel <''job-ID-submission-user''>'''
Contoh user membatalkan job submission milik user dengan ID 231.
$ scancel 231
|}
===Opsi Menggunakan Web EFIRO (EFIRO Job Composer)===
{| class="wikitable mw-collapsible mw-collapsed"
! colspan="2" |Langkah Menjalankan Quantum ESPRESSO di Web EFIRO
[[Berkas:Efirojobcomposer3.png|nirbing|500x500px]]
|-
|'''0'''
|
=====Login Web EFIRO=====
*[[Koneksi VPN ALELEON Supercomputer|'''User harus terhubung ke jaringan VPN ALELEON Supercomputer''']].
*Buka alamat web '''<code><nowiki>http://aleleon.ood</nowiki></code>'''  lalu masukkan username dan password user.
**Bagi user Linux, buka alamat <code>'''<nowiki>http://10.192.50.11</nowiki>'''</code>
|-
|'''1'''
|
=====Membuka Job Composer dan Memilih Template Job=====
*Buka menu '''<code>Jobs</code>''' > '''<code>Jobs Composer</code>''' pada dashboard EFIRO.
*Pilih '''<code>New Job</code>''' > '''<code>From Template</code>'''
[[Berkas:Efirojobcomposermenu.png|nir|jmpl|Menu '''<code>Jobs</code> > <code>Jobs Composer</code>''']][[Berkas:Jcnewjobmarked.png|al=|nir|jmpl|220x220px|Menu '''<code>New Jobs</code>''' > '''<code>From Template</code>''']]
|-
|'''2'''
|[[Berkas:Jcselecttemplate3.png|nirbing|600x600px]]
*PIlih template Quantum ESPRESSO yang diinginkan.
*Isi atau ganti kolom '''<code>Job Name</code>''' sesuai keinginan user.
*Apabila sudah selesai, klik '''<code>Create New Job</code>'''.
{| class="wikitable"
! colspan="2" |Template Quantum ESPRESSO yang tersedia
|-
!Nama Template
!Penjelasan
!Penjelasan
|-
|-
|Quantum ESPRESSO 6.7
|Quantum ESPRESSO 6.7
|Template standar QE versi 6.7
|Menjalankan Quantum ESPRESSO 6.7
|-
|-
|Quantum ESPRESSO 6.8
|Quantum ESPRESSO 6.8
|Template standar QE versi 6.8
|Menjalankan Quantum ESPRESSO 6.8
|-
|Quantum ESPRESSO 7.1
|Menjalankan Quantum ESPRESSO 7.1
|}
|}
Template Quantum ESPRESSO adalah set environment untuk menjalankan software Quantum ESPRESSO.
|-
*Klik '''New Jobs > From Template.'''
|'''3'''
* Pilih template Quantum ESPRESSO yang dibutuhkan.
|
*isi '''Job Name''' sesuai keinginan user kemudian klik '''Create New Job'''.
=====Menyiapkan File Komputasi=====
[[Berkas:Jcnewjobmarked.png|al=|nirbing|200x200px]]
[[Berkas:Jcjoboption3.png|nirbing|600x600px]]


---
Gunakan menu <code>'''Edit Files'''</code> untuk upload file komputasi yang dibutuhkan.
 
*Laman Edit Files juga dapat melakukan download / edit / rename / delete file.
[[Berkas:Jcselecttemplate3.png|al=|nirbing|600x600px]]
*Fitur upload pada Edit Files mempunyai limit kapasitas '''2GB per file'''.
=='''Mempersiapkan file input Quantum ESPRESSO'''==
**Gunakan [[Upload File dengan Aplikasi FTP|'''aplikasi FTP''']] untuk upload file tunggal diatas 2GB.
[[Berkas:Jcjoboption3.png|nirbing|600x600px]]
|-
*User dapat melakukan '''upload, editing, dan rename file input Quantum ESPRESSO''' melalui menu '''Edit Files.'''
| rowspan="2" |'''4'''
*Taruh input file pada direktori yang sama dengan file '''slurm-qe.sh.'''
|
=='''Melengkapi Submit Script Template'''==
=====Melengkapi Submit Script=====
Submit Script adalah "formulir" untuk menjalankan job komputasi user.
*Lengkapi Submit Script melalui menu '''<code>Open Editor</code>'''.
*Ikuti petunjuk NOTES di dalamnya.
*Jangan lupa klik <code>'''Save'''</code> setiap sekali mengubah script.
[[Berkas:Jceditor3.png|al=|nirbing|500x500px]]
[[Berkas:Jceditor3.png|al=|nirbing|500x500px]]
|-
|
=====Panduan Nilai Maksimal SBATCH=====
{| class="wikitable mw-collapsible mw-collapsed"
! colspan="5" |Panduan Nilai Maksimal SBATCH ntasks, mem, gpus, time
|-
!Skenario Komputasi
!ntasks
(CPU)
!mem
(RAM)
!gpus
(GPU)
!time
(time limit)
|-
|Fair policy usage untuk akumulasi semua job<sup>''1''</sup>
|128
|128GB
|2
| rowspan="3" |3-00:00:00
atau


* Melalui menu '''Open Editor''', user perlu melengkapi Submit Script supaya program Quantum ESPRESSO dapat berjalan:
72:00:00
** Parameter SBATCH.
|-
** Nama file input Quantum ESPRESSO.
|Quantum ESPRESSO''<sup>2</sup>''
 
|384
* Jangan lupa Save setiap sekali mengubah script.
|240GB''<sup>2</sup>''
[[Berkas:Save.png|nirbing|450x450px]]
|0
 
|-
---
|Quantum ESPRESSO di high-mem node
===Panduan lengkap mengisi Submit Script===
*Tambahkan <code>#SBATCH --nodelist=epyc001</code>
[[Berkas:Wiki-14.jpg|1000x1000px|link=SLURM Script ALELEON Supercomputer |alt=SLURM Script ALELEON Supercomputer ]]
|128
 
|500GB
'''Note:''' Submit Script pada dasarnya adalah '''SLURM Script''' karena ALELEON Supercomputer menggunakan manajemen SLURM untuk menjalankan job di Compute Node.
|0
=='''Fitur MPI pada Quantum ESPRESSO'''==
|-
Quantum ESPRESSO menggunakan MPI (Message Passing Interface) sehingga memberi kebebasan user untuk:
| colspan="5" |'''''Keterangan:'''''
{| class="wikitable"
#Limitasi untuk menjaga kualitas layanan ALELEON Supercomputer.
![[MPI ALELEON Supercomputer]]
#*User dapat mengajukan permintaan buka limitasi apabila butuh alokasi lebih.
#*Info detail buka laman [[Limitasi Fair Usage ALELEON Supercomputer|'''Limitasi Fair Usage ALELEON Supercomputer''']]
#QE mendukung komputasi paralel MPI. Ketika jumlah ntasks lebih dari 128:
#*SLURM otomatis menjalankan job pada multi-node.
#*Parameter mem adalah alokasi memori RAM per-node.
#*Info detail buka laman [[MPI ALELEON Supercomputer|'''MPI ALELEON Supercomputer''']].
|-
! colspan="5" |Keterangan tambahan
|-
| colspan="5" |
*'''Untuk akun perseorangan dengan Kredit Core Hour:'''
**SLURM akan menahan job apabila:
***ntasks * time (jam) lebih besar dari sisa CPU Core Hour user.
***gpus * time (jam) lebih besar dari sisa GPU Hour user.
**Cek sisa Kredit Core Hour melalui menu '''<code>Open Terminal</code>''' dan jalankan perintah:
$ '''sausage'''
[[Berkas:Jcjoboption4.png|nirbing|600x600px]]
*Info SBATCH lebih detail lihat laman [[Submit Script ALELEON Supercomputer|'''Submit Script ALELEON Supercomputer''']]
|}
|-
|-
|'''5'''
|
|
*[https://wiki.efisonlt.com/wiki/MPI_ALELEON_Supercomputer#MPI_Satu_Node_vs_Multi_Node '''MPI Satu Node vs Multi Node''']
=====Menjalankan Job Komputasi=====
**User dapat menjalankan Quantum ESPRESSO hanya dengan 1 node (maksimal 128 core thread CPU)
Jalankan job dengan klik tombol '''<code>Submit</code>'''.
**Atau menggunakan '''multi-node''' alias '''lebih dari 128 core thread CPU'''.
|}
=='''Menjalankan Job'''==
Semua file untuk menjalankan program dan Submit Script sudah siap? Jalankan job dengan menekan tombol '''Submit'''.


[[Berkas:Jcsubmit2.png|al=|nirbing|600x600px]]
[[Berkas:Jcsubmit2.png|al=|nirbing|600x600px]]
*Perhatikan status jalannya job pada kolom '''Status.'''
{| class="wikitable"
{| class="wikitable"
|+''Penjelasan kolom '''<code>Status</code>,''' pantau dengan refresh halaman job''
!Status
!Status
!Arti
!Arti
Baris 90: Baris 397:
|Queue
|Queue
|Job mengantri dan belum berjalan.
|Job mengantri dan belum berjalan.
{| class="wikitable mw-collapsible mw-collapsed"
!Langkah melihat status job ketika queue
|-
|Buka <code>'''Jobs > Active Jobs'''</code> pada dashboard EFIRO.
*Lakukan langkah sesuai gambar dibawah ini
[[Berkas:Efiroqueueedit.png|al=|jmpl|''Halaman Active Jobs. Ubah opsi '''<code>Your jobs</code>''' untuk melihat status job user saja. Klik simbol '''>''' untuk melihat status  job pending pada kolom '''Reason'''. Arti reason lihat laman '''[[Daftar Reason NODELIST ALELEON Supercomputer]].'''''|kiri]]
|}
|-
|-
|Completed
|Completed
Baris 95: Baris 409:
|-
|-
|Failed
|Failed
|Job berhenti di tengah jalan,
|Job berhenti di tengah jalan, bisa karena di Stop atau Delete oleh user.
Bisa karena di Stop atau Delete oleh user.
|}
|}
*User dapat memantau perubahan kolom Status dengan me-refresh halaman Job.
=====Menghentikan Job Komputasi=====
*Apabila user ingin menghentikan job yang sedang berjalan, klik tombol '''Stop''' yang berada di sebelah tombol Submit.
Untuk menghentikan job yang tengah berjalan, klik tombol '''<code>Stop</code>'''.
=='''Melihat hasil job yang selesai'''==
 
Apabila job sudah selesai (status Completed), user dapat melihat hasil output job melalui bagian '''Folder Contents''' atau membuka halaman '''Edit Pages.'''[[Berkas:Jcfoldercontentsedit.png|al=|nir|jmpl|'''Kolom Folder Contents melihat isi dari ruang direktori job. User dapat melihat semua file output yang keluar di kolom ini.''']][[Berkas:Jcjoboption3.png|nir|jmpl|'''atau dengan membuka menu Edit Files. Melalui halaman ini user juga dapat melakukan revisi file input misalnya apabila hasil output tidak sesuai yang diharapkan.''']]
[[Berkas:Stop.png|nirbing|600x600px]]
=='''Submit ulang job'''==
|-
User dapat '''menjalankan ulang ruang job yang sama''' (misalkan ketika ada koreksi file input atau Submit Script) dengan mengklik kembali tombol Submit.
|'''6A'''
|
=====Melihat Output Komputasi=====
User dapat melihat output file komputasi pada kolom '''<code>Folder Contents</code>'''
*Atau dengan membuka '''<code>Edit Files</code>'''
[[Berkas:Jcfoldercontentsedit.png|al=|nir|jmpl|Kolom '''<code>Folder Contents</code>'''.]]
|-
|'''6B'''
|User dapat '''menjalankan ulang ruang job yang sama''' dengan mengklik kembali tombol '''<code>Submit</code>'''.
|}
=='''Notifikasi Status Jalannya Komputasi via email'''==
SLURM ALELEON Supercomputer dapat mengirim notifikasi email kepada user dengan nama "Jojo" untuk mengabarkan status berjalannya job komputasi user. Silahkan tambahan SBATCH berikut pada Submit Script apabila user ingin menerima notifikasi email dari SLURM:<syntaxhighlight lang="bash">
#SBATCH --mail-user=<alamat-email-user>
#SBATCH --mail-type=BEGIN,END,FAIL
</syntaxhighlight>SBATCH mail-type mengatur konten email notifikasi SLURM dengan pilihan opsi yang sekiranya berguna untuk user:
*BEGIN -> notifikasi job sudah mulai
*END -> notifikasi job sudah selesai beserta cuplikan 20 baris terakhir dari file SBATCH output dan error.
*FAIL -> notifikasi apabila job gagal berjalan atau berhenti tidak sewajarnya.
*TIME_LIMIT_50 -> job telah berjalan dengan durasi waktu 50% time limit.
*TIME_LIMIT_80 -> job telah berjalan dengan durasi waktu 80% time limit.
=='''Pelaporan Kendala dan Support'''==
Apabila menjumpai masalah teknis dalam menjalankan komputasi, silahkan lapor dengan klik gambar berikut ini.
 
[[Berkas:Wiki-pelaporankendala.jpg|1000x1000px|link=https://efisonlt.com/aleleonbugreport]]
 
---
 
Bila terdapat pertanyaan lainnya, silahkan hubungi admin EFISON melalui email:
'''support@efisonlt.com'''

Revisi terkini sejak 12 Januari 2024 11.31

Quantum ogo ok.png

Quantum ESPRESSO adalah framework suite untuk kalkulasi electronic-structure dan modeling material berdasarkan density-functional theory (DFT), plane waves, dan pseudopotentials.

Modul Quantum ESPRESSO

Berikut adalah detail versi Quantum ESPRESSO yang tersedia secara global di ALELEON Supercomputer:

Modul Quantum ESPRESSO
Versi Nama modul Dukungan hardware
CPU GPU OMP

Threading

MPI

multi-node

6.7 qe/6.7-GCC10-MKL-LibM V - - V
6.8 qe/6.8-GCC10-MKL-LibM V - - V
7.1 qe/7.1-GCC11.3-AOCL4.0-ELPA2022.05-Libxc6.1.0 V - - V

Info Perubahan Menjalankan Quantum ESPRESSO di ALELEON

Terdapat perubahan sintaks MPI untuk menjalankan Quantum ESPRESSO berdasarkan update scheduler SLURM ALELEON Supercomputer pada maintenance 7-12 Januari 2024 yaitu:

  • Menggunakan mpirun biasa untuk menjalankan QE satu node.
  • Menggunakan mpirun dengan sintaks UCX untuk menjalankan QE multi-node

Perubahan ini telah diupdate pada tutorial template SLURM Submit Script dan Template Job Composer untuk Quantum ESPRESSO dengan skema sintaks MPI berikut:

...

if [ $SLURM_NNODES -eq 1 ]
then
	echo "Terdeteksi running QE dengan 1 node"
	mpirun -np ${SLURM_NTASKS} pw.x -input ${INPUT_FILE}
elif [ $SLURM_NNODES -gt 1 ]
then
	echo "Terdeteksi running QE dengan ${SLURM_NNODES} node"
	mpirun -np ${SLURM_NTASKS} --mca pml ucx --mca osc ucx pw.x -input ${INPUT_FILE}
fi

Menjalankan Quantum ESPRESSO

User dapat menjalankan komputasi dengan pilihan cara melalui terminal atau website EFIRO (klik expand atau kembangkan).

Opsi Menggunakan terminal (SLURM sbatch)

Langkah Menjalankan Quantum ESPRESSO di Terminal

Sbatch Terminal.png

0
Login SSH

Tatacara login SSH lihat laman Login SSH ALELEON Supercomputer.

1
Menyiapkan File Komputasi

Siapkan file yang dibutuhkan untuk komputasi user, rekomendasi dalam satu folder per job:

  • File input dan data komputasi.
    • User dapat upload / download file ke ALELEON dengan software FTP.
  • Membuat SLURM Submit Script yaitu 'formulir' untuk menjalankan job komputasi.
    • Nama script bebas dengan format file .sh (bash), contoh my_job_submission.sh
$ mkdir kerjaanskripsi
$ cd kerjaanskripsi
$ nano my_job_submission.sh

... upload / menyiapkan / edit input dan data komputasi ...
2
Template SLURM Submit Script Quantum ESPRESSO

Ikuti panduan template berikut dan petunjuk NOTES di dalamnya.

Template SLURM Submit Script untuk Quantum ESPRESSO versi CPU
#!/bin/bash

# -----------------------------------------------------
# Template SLURM Submit Script
# Quantum ESPRESSO | rev.080124
# 
# NOTES: 
# 1. Isi bagian yang ditandai 4 garing (////).
# 2. Template ini bersifat referensi.
#    User dapat mengubah bagian yang perlu diubah.
# -----------------------------------------------------

# -----------------------------------------------------
# Alokasi komputasi SBATCH, input, dan module
# -----------------------------------------------------

# Alokasi jumlah core thread CPU
#SBATCH --ntasks=////

# Alokasi jumlah memori RAM (satuan GB)
#SBATCH --mem=////GB

# Alokasi limit waktu menjalankan job
# Format HH:MM:SS atau D-HH:MM:SS
#SBATCH --time=////

# Definisi file untuk menampung output terminal program
#SBATCH --output=result-%j.txt

# Definisi file untuk menampung output error log    
#SBATCH --error=error-%j.txt 

# Nama input file Quantum ESPRESSO yang dijalankan
INPUT_FILE="////.in"

# Memuat modul software Quantum ESPRESSO
# Daftar modul lihat subbab "Modul Quantum ESPRESSO" di atas 
module load qe////

# ----------------------------------------------------
# Script jalannya program
# ----------------------------------------------------

# Perintah menjakankan Quantum ESPERESSO
# Kondisi khusus dimana 1 node -> mpirun tanpa UCX
# 2 node -> mpirun dengan UCX

if [ $SLURM_NNODES -eq 1 ]
then
	echo "Terdeteksi running QE dengan 1 node"
	mpirun -np ${SLURM_NTASKS} pw.x -input ${INPUT_FILE}
elif [ $SLURM_NNODES -gt 1 ]
then
	echo "Terdeteksi running QE dengan 2 node"
	mpirun -np ${SLURM_NTASKS} --mca pml ucx --mca osc ucx pw.x -input ${INPUT_FILE}
fi
Panduan Nilai Maksimal SBATCH untuk Quantum ESPRESSO
Panduan Nilai Maksimal SBATCH ntasks, mem, gpus, time
Skenario Komputasi ntasks

(CPU)

mem

(RAM)

gpus

(GPU)

time

(time limit)

Fair policy usage untuk akumulasi semua job1 128 128GB 2 3-00:00:00

atau

72:00:00

Quantum ESPRESSO2 384 240GB2 0
Quantum ESPRESSO di high-mem node
  • Tambahkan #SBATCH --nodelist=epyc001
128 500GB 0
Keterangan:
  1. Limitasi untuk menjaga kualitas layanan ALELEON Supercomputer.
  2. QE mendukung komputasi paralel MPI. Ketika jumlah ntasks lebih dari 128:
    • SLURM otomatis menjalankan job pada multi-node.
    • Parameter mem adalah alokasi memori RAM per-node.
    • Info detail buka laman MPI ALELEON Supercomputer.
Keterangan tambahan
  • Untuk akun perseorangan dengan Kredit Core Hour:
    • SLURM akan menahan job apabila:
      • ntasks * time (jam) lebih besar dari sisa CPU Core Hour user.
      • gpus * time (jam) lebih besar dari sisa GPU Hour user.
    • Cek sisa Kredit Core Hour melalui perintah:
$ sausage
3
Menjalankan Job Komputasi

Jalankan job dengan perintah sbatch.

$ sbatch <nama-SLURM-Submit-script>

Contoh menjalankan nama script my_job_submission.sh.

$ sbatch my_job_submission.sh
4A User dapat melihat status jalannya job dengan perintah squeue berikut.
  • Apabila tidak ada output artinya tidak ada job user yang berjalan / antri pada waktu itu.
$ squeue -ul $USER

Berikut adalah daftar STATE (ST) dari squeue yang menunjukkan status berjalannya job:

Daftar STATE squeue SLURM
STATE Kepanjangan Penjelasan
R RUN Job berjalan
PD PENDING Job tertahan, lihat keterangan NODELIST(REASON)
CG COMPLETING Job selesai dan dalam proses clean-up SLURM
CA CANCELED Job dibatalkan oleh user
PR PREEMPETED Job dibatalkan oleh admin EFISON, alasan dikabarkan melalui email
S SUSPENDED Job ditahan oleh admin EFISON
4B
Menghentikan Job Komputasi

Apabila user ingin membatalkan job, gunakan perintah scancel berdasarkan job ID.

  • Job ID dapat dilihat melalui perintah squeue pada kolom JOBID.
  • User hanya bisa membatalkan job submission milik user sendiri.
$ scancel <job-ID-submission-user>

Contoh user membatalkan job submission milik user dengan ID 231.

$ scancel 231

Opsi Menggunakan Web EFIRO (EFIRO Job Composer)

Langkah Menjalankan Quantum ESPRESSO di Web EFIRO

Efirojobcomposer3.png

0
Login Web EFIRO
1
Membuka Job Composer dan Memilih Template Job
  • Buka menu Jobs > Jobs Composer pada dashboard EFIRO.
  • Pilih New Job > From Template
Menu Jobs > Jobs Composer
Menu New Jobs > From Template
2 Jcselecttemplate3.png
  • PIlih template Quantum ESPRESSO yang diinginkan.
  • Isi atau ganti kolom Job Name sesuai keinginan user.
  • Apabila sudah selesai, klik Create New Job.
Template Quantum ESPRESSO yang tersedia
Nama Template Penjelasan
Quantum ESPRESSO 6.7 Menjalankan Quantum ESPRESSO 6.7
Quantum ESPRESSO 6.8 Menjalankan Quantum ESPRESSO 6.8
Quantum ESPRESSO 7.1 Menjalankan Quantum ESPRESSO 7.1
3
Menyiapkan File Komputasi

Jcjoboption3.png

Gunakan menu Edit Files untuk upload file komputasi yang dibutuhkan.

  • Laman Edit Files juga dapat melakukan download / edit / rename / delete file.
  • Fitur upload pada Edit Files mempunyai limit kapasitas 2GB per file.
4
Melengkapi Submit Script

Submit Script adalah "formulir" untuk menjalankan job komputasi user.

  • Lengkapi Submit Script melalui menu Open Editor.
  • Ikuti petunjuk NOTES di dalamnya.
  • Jangan lupa klik Save setiap sekali mengubah script.

Panduan Nilai Maksimal SBATCH
Panduan Nilai Maksimal SBATCH ntasks, mem, gpus, time
Skenario Komputasi ntasks

(CPU)

mem

(RAM)

gpus

(GPU)

time

(time limit)

Fair policy usage untuk akumulasi semua job1 128 128GB 2 3-00:00:00

atau

72:00:00

Quantum ESPRESSO2 384 240GB2 0
Quantum ESPRESSO di high-mem node
  • Tambahkan #SBATCH --nodelist=epyc001
128 500GB 0
Keterangan:
  1. Limitasi untuk menjaga kualitas layanan ALELEON Supercomputer.
  2. QE mendukung komputasi paralel MPI. Ketika jumlah ntasks lebih dari 128:
    • SLURM otomatis menjalankan job pada multi-node.
    • Parameter mem adalah alokasi memori RAM per-node.
    • Info detail buka laman MPI ALELEON Supercomputer.
Keterangan tambahan
  • Untuk akun perseorangan dengan Kredit Core Hour:
    • SLURM akan menahan job apabila:
      • ntasks * time (jam) lebih besar dari sisa CPU Core Hour user.
      • gpus * time (jam) lebih besar dari sisa GPU Hour user.
    • Cek sisa Kredit Core Hour melalui menu Open Terminal dan jalankan perintah:
$ sausage

Jcjoboption4.png

5
Menjalankan Job Komputasi

Jalankan job dengan klik tombol Submit.

Penjelasan kolom Status, pantau dengan refresh halaman job
Status Arti
Not Submitted Job belum pernah dijalankan.
Running Job berjalan.
Queue Job mengantri dan belum berjalan.
Langkah melihat status job ketika queue
Buka Jobs > Active Jobs pada dashboard EFIRO.
  • Lakukan langkah sesuai gambar dibawah ini
Halaman Active Jobs. Ubah opsi Your jobs untuk melihat status job user saja. Klik simbol > untuk melihat status job pending pada kolom Reason. Arti reason lihat laman Daftar Reason NODELIST ALELEON Supercomputer.
Completed Job selesai berjalan.
Failed Job berhenti di tengah jalan, bisa karena di Stop atau Delete oleh user.
Menghentikan Job Komputasi

Untuk menghentikan job yang tengah berjalan, klik tombol Stop.

Stop.png

6A
Melihat Output Komputasi

User dapat melihat output file komputasi pada kolom Folder Contents

  • Atau dengan membuka Edit Files
Kolom Folder Contents.
6B User dapat menjalankan ulang ruang job yang sama dengan mengklik kembali tombol Submit.

Notifikasi Status Jalannya Komputasi via email

SLURM ALELEON Supercomputer dapat mengirim notifikasi email kepada user dengan nama "Jojo" untuk mengabarkan status berjalannya job komputasi user. Silahkan tambahan SBATCH berikut pada Submit Script apabila user ingin menerima notifikasi email dari SLURM:

#SBATCH --mail-user=<alamat-email-user> 
#SBATCH --mail-type=BEGIN,END,FAIL

SBATCH mail-type mengatur konten email notifikasi SLURM dengan pilihan opsi yang sekiranya berguna untuk user:

  • BEGIN -> notifikasi job sudah mulai
  • END -> notifikasi job sudah selesai beserta cuplikan 20 baris terakhir dari file SBATCH output dan error.
  • FAIL -> notifikasi apabila job gagal berjalan atau berhenti tidak sewajarnya.
  • TIME_LIMIT_50 -> job telah berjalan dengan durasi waktu 50% time limit.
  • TIME_LIMIT_80 -> job telah berjalan dengan durasi waktu 80% time limit.

Pelaporan Kendala dan Support

Apabila menjumpai masalah teknis dalam menjalankan komputasi, silahkan lapor dengan klik gambar berikut ini.

Wiki-pelaporankendala.jpg

---

Bila terdapat pertanyaan lainnya, silahkan hubungi admin EFISON melalui email:

support@efisonlt.com