OpenMX: Perbedaan antara revisi

Dari ALELEON by EFISON
(paraphrasing hybrid mpi/omp dan format baru pilihan menjalankan komputasi)
 
Baris 62: Baris 62:
  '''#SBATCH --cpus-per-task='''''[isi-sesuai-keinginan]''
  '''#SBATCH --cpus-per-task='''''[isi-sesuai-keinginan]''
=='''Metode Menjalankan Komputasi'''==
=='''Metode Menjalankan Komputasi'''==
User dapat memilih metode menjalankan komputasi sesuai keinginan:
User dapat menjalankan OpenMX dengan pilihan metode:


* '''Job submission Slurm'''
=== Batch Job ===
** ''Menjalankan komputasi di [[Spesifikasi ALELEON Supercomputer#Spesifikasi%20Compute%20Node|compute node]] melalui manajemen Slurm kemudian user menunggu hingga selesai.''
Menjalankan komputasi di [[Spesifikasi ALELEON Supercomputer#Spesifikasi%20Compute%20Node|compute node]] melalui manajemen Slurm kemudian user menunggu hingga selesai. Terdapat dua opsi tampilan yang dapat dipilih sesuai preferensi user: ''<small>(klik expand atau kembangkan)</small>''
** ''Hanya untuk file Python (.py) siap jalan, file ipynb harus diubah ke py.''
* '''Sesi Interaktif Slurm'''
** ''coming soon!''
 
=== Job Submission Slurm ===
Terdapat dua pilihan tampilan yaitu dengan terminal dan web EFIRO.
{| class="wikitable mw-collapsible mw-collapsed"
{| class="wikitable mw-collapsible mw-collapsed"
!Langkah Job Submission Slurm di Terminal
!Langkah Job Submission Slurm di Terminal

Revisi terkini sejak 18 Desember 2024 07.50

OpenMX Logo.png

OpenMX adalah software package untuk simulasi material skala nano berdasarkan DFT (Density Functional Theories), norm-conserving pseudopotensials, dan pseudo-atomic localized basis functinons. OpenMX merupakan software tidak berbayar dengan lisensi GNU GPLv3.

Modul OpenMX

Berikut adalah detail versi OpenMX yang tersedia secara global di ALELEON Supercomputer:

Modul OpenMX
Versi Nama modul Modul

DEFAULT

Dukungan hardware
CPU GPU OMP

Threading

MPI

multi-node

3.9.9 openmx/3.9.9-GCC11.3-AOCL4.0 V V - V V

DATA.PATH pada File Input

User wajib mendefinisikan DATA.PATH berikut pada file input supaya OpenMX dapat berjalan. Daftar DATA.PATH per versi OpenMX lihat tabel di bawah.

DATA.PATH        [data-path-OpenMX]
Daftar DATA.PATH OpenMX
Versi DATA.PATH
3.9.9 /comp/openmx/3.9.9-GCC11.3-AOCL4.0/DFT_DATA19

Pilihan MPI atau Threading OpenMP untuk Menjalankan OpenMX

OpenMX di ALELEON Supercomputer dapat berjalan melalui paralelisasi MPI, OpenMP (OMP), atau keduanya (hybrid MPI/OMP) untuk menggunakan multi-core CPU dan multi-node. Admin menyerahkan keputusan kepada user untuk memilih metode paralelisasi melalui parameter Submit Script berikut:

  • Penjelasan submit script lihat subbab berikutnya (Pilihan Menjalankan Komputasi).
  • SBATCH ntasks mewakili jumlah task MPI sedangkan SBATCH cpus-per-task mewakili jumlah thread OMP.
#SBATCH --ntasks -> mewakili jumlah task MPI
#SBATCH --cpus-per-task -> mewakili jumlah thread OpenMP
  • Apabila ingin MPI saja, isi jumlah SBATCH cpus-per-task dengan 1:
# Pure MPI 
#SBATCH --ntasks=[isi-sesuai-keinginan]
#SBATCH --cpus-per-task=1
  • Apabila ingin Hybrid MPI/OMP, isi kedua parameter tersebut:
    • Total core CPU yang digunakan adalah ntasks * cpus-per-task.
    • Contoh menggunakan 2 proses MPI dan 4 thread OMP per MPI sehingga total menggunakan 8 core CPU:
# Hybrid MPI/OMP, contoh dengan 2 proses MPI dan 4 thread OMP per MPI.
#SBATCH --ntasks=2
#SBATCH --cpus-per-task=4
  • Apabila ingin OMP saja, isi jumlah ntasks dengan 1:
# Pure OMP 
#SBATCH --ntasks=1
#SBATCH --cpus-per-task=[isi-sesuai-keinginan]

Metode Menjalankan Komputasi

User dapat menjalankan OpenMX dengan pilihan metode:

Batch Job

Menjalankan komputasi di compute node melalui manajemen Slurm kemudian user menunggu hingga selesai. Terdapat dua opsi tampilan yang dapat dipilih sesuai preferensi user: (klik expand atau kembangkan)

Langkah Job Submission Slurm di Terminal

Sbatch terminal display rev2.png

1
Login SSH ke ALELEON Supercomputer.
2
Siapkan file komputasi yang dibutuhkan.
  • Perhatikan DATA.PATH pada file input.
  • User dapat upload / download file dengan software FTP.
3A
Buat Submit Script yaitu 'formulir' untuk menjalankan job komputasi.
  • Nama file bebas dengan format .sh, contoh submit.sh
Contoh template Submit Script, ikuti petunjuk NOTES didalamnya.
  • Klik expand / kembangkan
Template Submit Script OpenMX
#!/bin/bash

# -----------------------------------------------------
# Template SLURM Submit Script
# OpenMX | rev.080124
# 
# NOTES: 
# 1. Isi bagian yang ditandai 4 garing (////).
# 2. Template ini bersifat referensi.
#    User dapat mengubah bagian yang perlu diubah.
# 3. Perhatikan rate CCH = ntasks * cpus-per-task.
# -----------------------------------------------------

# -----------------------------------------------------
# Alokasi komputasi SBATCH, input, dan module
# -----------------------------------------------------

# Alokasi jumlah core thread CPU, mewakili jumlah task MPI
#SBATCH --ntasks=////

# Alokasi jumlah thread OMP per task MPI
#SBATCH --cpus-per-task=////

# Alokasi jumlah memori RAM (satuan GB)
#SBATCH --mem=////GB

# Alokasi limit waktu menjalankan job
# Format HH:MM:SS atau D-HH:MM:SS
#SBATCH --time=////

# Definisi file untuk menampung output terminal program
#SBATCH --output=result-%j.txt

# Definisi file untuk menampung output error log    
#SBATCH --error=error-%j.txt 

# Nama input file OpenMX yang dijalankan
INPUT_FILE='////.dat'

# Memuat modul software OpenMX
# Daftar modul lihat subbab "Modul OpenMX" di atas 
module load openmx////

# ----------------------------------------------------
# Script jalannya program
# ----------------------------------------------------

# Definisi threading OMP 
export OMP_NUM_THREADS=${SLURM_CPUS_PER_TASK}

# Perintah menjakankan OpenMX
mpirun -np ${SLURM_NTASKS} openmx ${INPUT_FILE}
  • Untuk SBATCH notifikasi email status jalannya job lihat Slurm Jojo.
3B
SBATCH komputasi (ntasks, mem, time, dll) mempunyai limit berdasarkan:
  • Sisa Core Hour user dan Fair Usage Limit.
  • Spesifikasi sistem dan software komputasi.

Untuk melihat limit, jalankan perintah berikut:

$ slimit-hympi 
4
Jalankan job komputasi dengan perintah:
$ sbatch [nama-submit-script]

Contoh:
$ sbatch submit.sh
5
User dapat melihat status jalannya job dengan perintah:

$ squeue -ul $USER

Kolom ST atau STATE menunjukkan status jalannya job.
STATE Penjelasan
R (RUN) Job berjalan
PD (PENDING) Job tertahan, lihat NODELIST(REASON)
CG (COMPLETING) Job selesai dan dalam proses clean-up
CA (CANCELED) Job dibatalkan user
PR (PREEMPETED) Job dibatalkan admin, alasan dikabarkan via email
S (SUSPENDED) Job ditahan admin, alasan dikabarkan via email
Apabila user ingin menghentikan job yang berjalan, jalankan perintah:
$ scancel [job-ID]

Job ID ada pada squeue diatas.
contoh membatalkan job ID 231:
$ scancel 231 
Langkah Job Submission Slurm di Web EFIRO

Efiro jobcomposer display.png

1
Login ke web EFIRO ALELEON Supercomputer.
2
New Pinnedapps jc.pngBuka pinned apps Job Composer di homepage EFIRO.

Pilih menu New Job -> From Template

Jcnewjobmarked.png

3
Pilih template OpenMX yang diinginkan:
Nama Template Penjelasan
OpenMX 3.9.9 Menjalankan OpenMX 3.9.9
Kemudian Isi Job Name dan klik Create New Job

Jctemplate-2.png

4
Siapkan file komputasi yang dibutuhkan:
  • Upload file melalui menu Edit Files
  • Perhatikan DATA.PATH pada file input.

JC job menu.png

5A
Lengkapi Submit Script melalui tombol Open Editor.

  • Submit script adalah 'formulir' untuk menjalankan job komputasi.
  • Ikuti petunjuk NOTES didalamnya
  • Klik Save setiap kali mengubah script.
5B
SBATCH komputasi (ntasks, mem, time, dll) mempunyai limit berdasarkan:
  • Sisa Core Hour user dan Fair Usage Limit.
  • Spesifikasi sistem dan software komputasi.

Untuk melihat limit, jalankan perintah berikut pada terminal:

$ slimit-hympi
6
Jalankan job dengan klik tombol Submit.
  • Pantau kolom status yang menjelaskan status jalannya job.
  • Apabila ingin membatalkan job yang berjalan, klik Stop.

Daftar status job
Status Arti
Not Submitted Job belum pernah dijalankan.
Running Job berjalan.
Queue Job mengantri dan belum berjalan.
Completed Job selesai berjalan.
Failed Job berhenti karena error atau di stop user.
Untuk melihat alasan job yang queue:
Buka pinned apps Active Jobs di homepage EFIRO. Ubah opsi All jobs ke Your Jobs. Klik simbol > untuk melihat status job yang pending pada kolom Reason. Arti reason lihat laman Daftar Reason NODELIST ALELEON Supercomputer.
7
Lihat output file komputasi pada kolom Folder Contents
  • Atau dengan membuka Edit Files
Kolom Folder Contents.
8
Untuk menghapus ruang job dan datanya:
  • Pilih ruang job yang akan dihapus.
  • Klik menu Delete

JC delete menu.png

Pelaporan Kendala dan Support

Apabila menjumpai masalah teknis dalam menjalankan komputasi, silahkan lapor dengan klik gambar berikut ini.

Wiki-pelaporankendala.jpg

---

Bila terdapat pertanyaan lainnya, silahkan hubungi admin EFISON melalui email:

support@efisonlt.com