DFTB+

Dari ALELEON by EFISON

Revisi sejak 10 Oktober 2023 11.03 oleh WilsonLisan (bicara | kontrib) (→‎Terminal - SLURM sbatch: membuat script non-collapsible)

DFTB logo.png

DFTB+ adalah software package yang versatil untuk simulasi mechanical quantum. DFTB+ merupakan software tidak berbayar dengan lisensi GNU Lesser General Public License.

Modul DFTB+

Berikut adalah detail versi DFTB+ yang tersedia secara global di ALELEON Supercomputer:

Versi Nama modul Modul

DEFAULT

Dukungan hardware
CPU GPU OMP

Threading

MPI

multi-node

22.2 dftbplus/22.2-GCC11.3-AOCL4.0 V V - V V

Pilihan MPI atau Threading OpenMP pada DFTB+ versi CPU

DFTB+ secara default berjalan dengan paralelisasi OpenMP (OMP). Sementara itu DFTB+ pada ALELEON Supercomputer dicompile dengan MPI sehingga dapat berjalan dengan paralelisasi hybrid MPI/OMP. ALELEON Supercomputer menyerahkan keputusan kepada user untuk memilih metode paralelisasi tersebut melalui konfigurasi pada SLURM Submit Script (lihat subbab Menjalankan DFTB+ di Compute Node):

  • SBATCH ntasks mewakili jumlah task MPI sedangkan SBATCH cpus-per-task mewakili jumlah thread OMP.
#SBATCH --ntasks -> mewakili jumlah task MPI
#SBATCH --cpus-per-task -> mewakili jumlah thread OpenMP
  • Apabila ingin Pure MPI maka isi jumlah SBATCH cpus-per-task dengan 1.
# Pure MPI 
#SBATCH --ntasks=<isi-sesuai-keinginan>
#SBATCH --cpus-per-task=1
  • Apabila ingin Hybrid MPI/OMP maka isi kedua parameter tersebut. Perlu diingat bahwa total core CPU yang digunakan adalah ntasks * cpus-per-task. Contoh berikut menggunakan 2 proses MPI dan 4 thread OMP per MPI sehingga total menggunakan 8 core CPU:
# Hybrid MPI/OMP, contoh dengan 2 proses MPI dan 4 thread OMP per MPI.
#SBATCH --ntasks=2
#SBATCH --cpus-per-task=4
  • Apabila ingin Pure OMP maka isi jumlah ntasks dengan 1.
# Pure OMP 
#SBATCH --ntasks=1
#SBATCH --cpus-per-task=<isi-sesuai-keinginan>

Menjalankan DFTB+ di Compute Node

User dapat menjalankan komputasi dengan pilihan cara melalui tampilan terminal atau GUI web EFIRO.

Mengecek Kredit Core Hour bagi Akun Perseorangan

User dengan akun perseorangan disarankan untuk selalu mengecek sisa Kredit Core Hour sebelum melakukan job submission dengan menjalankan perintah pada terminal:

$ sausage

Bagi yang login ke web EFIRO, buka terminal pada menu Clusters > Aleleon Shell Access

Terminal - SLURM sbatch

Sbatch Terminal.png

Menjalankan komputasi pada terminal melalui job submission SLURM sbatch.

Langkah Menjalankan CP2K via SLURM sbatch
0 Sebelum login, user harus terhubung ke jaringan VPN ALELEON Supercomputer.
Login dengan SSH:
  • User OS Windows dan MacOS -> $ ssh <username>@aleleon.hpc
  • User OS Linux -> $ ssh <username>@10.192.50.10
1 Siapkan file yang dibutuhkan untuk menjalankan komputasi user.
2

File Input dftb_in.hsd

Buat / upload file input DFTB+ dengan nama dan format dftb_in.hsd.

  • File input ini harus ditaruh pada satu direktori dengan SLURM Submit Script (langkah 4).
3A

File Slaster-Koster (SK)

File input DFTB+ membutuhkan file Slater-Koster (SK) pada bagian Hamiltonian yang bisa didapatkan pada:

File dalam format .tar sehingga perlu di ekstrak.

3B Admin menyarankan menaruh / upload folder SK pada direktori HOME supaya dapat diakses oleh banyak job.
$HOME/<folder-file-SK-yang-dibutuhkan>

Pastikan file input pada bagian Hamiltonian menunjuk direktori file SK spesifik pada HOME tersebut.

4

Menjalankan DFTB+

Buat SLURM Submit Script yaitu 'formulir' untuk menjalankan job dengan panduan berikut:

  • Nama script dibebaskan dengan format file .sh (bash), contoh my_job_submission.sh
  • Buat script pada direktori yang sama dengan file komputasi yang akan dijalankan.
  • Ikuti panduan template berikut dan petunjuk pada NOTES di dalamnya.
Panduan nilai maks SBATCH untuk DFTB+1
Parameter SBATCH Fair policy usage2 Multi-node MPI3 High-mem node

epyc0014

ntasks (CPU) * cpus-per-task (OMP) 128 384 128
mem (RAM) 128GB 240GB 500GB
time (time limit) 3-00:00:00 atau 72:00:00
gpus (GPU) 2 0 0
Note:
  1. Info SBATCH lebih detail lihat laman Submit Script ALELEON Supercomputer
  2. Limitasi fair policy usage untuk menjaga kualitas layanan ALELEON Supercomputer.
  3. DFTB+ mendukung komputasi paralel MPI untuk berjalan multi-node lebih dari 128 core thread.
  4. User dapat menggunakan memori RAM hingga 500GB pada node epyc001 saja.
    • Tambahkan parameter #SBATCH --nodelist=epyc001
Template SLURM Submit Script DFTB+
#!/bin/bash

# -------------------------------------------------------------
# | Template SLURM Submit Script
# | Software        : DFTB+
# | Update script  r: 06/10/2023
# |
# | NOTES: 
# | 1. Isi bagian yang ditandai 4 garing (////).
# | 2. Template ini bersifat referensi.
# |    User dapat mengubah bagian yang sekiranya perlu diubah.
# | 3. Panduan menjalankan CP2K di ALELEON lihat: 
# |    wiki.efisonlt.com/wiki/DFTB%2B 
# -------------------------------------------------------------

# --------------------------------------------------
# Alokasi komputasi, modul software, dan file input
# --------------------------------------------------

# Alokasi jumlah core thread CPU. mewakili jumlah task MPI
#SBATCH --ntasks=////

# Alokasi jumlah thread OMP per task MPI
#SBATCH --cpus-per-task=////

# Alokasi jumlah memori RAM (satuan GB)
#SBATCH --mem=////GB

# Alokasi limit waktu menjalankan job.
# Format HH:MM:SS atau D-HH:MM:SS 
#SBATCH --time=////

# Definisi file untuk menampung output terminal
#SBATCH --output=result-%j.txt

# Definisi file untuk menampung output error log    
#SBATCH --error=error-%j.txt 

# Memuat modul software DFTB+
# Daftar modul DFTB+ lihat subbab "Modul DFTB+" pada
# wiki.efisonlt.com/wiki/DFTB%2B 
module load dftbplus////

# -------------------------------------------------
# RUN SCRIPT
# -------------------------------------------------

# Definisi threading OMP 
export OMP_NUM_THREADS=$SLURM_CPUS_PER_TASK

# Perintah menjakankan DFTB+
mpirun -np $SLURM_NTASKS dftb+
5 Jalankan job dengan perintah sbatch.
$ sbatch <nama-SLURM-Submit-script>

Contoh menjalankan nama script my_job_submission.sh.

$ sbatch my_job_submission.sh
6A User dapat melihat status jalannya job dengan perintah squeue berikut.
  • Apabila tidak ada output artinya tidak ada job user yang berjalan / antri pada waktu itu.
$ squeue -ul $USER

Berikut adalah daftar STATE (ST) dari squeue yang menunjukkan status berjalannya job:

Daftar STATE squeue SLURM
STATE Kepanjangan Penjelasan
R RUN Job berjalan
PD PENDING Job tertahan, lihat keterangan NODELIST(REASON)
CG COMPLETING Job selesai dan dalam proses clean-up SLURM
CA CANCELED Job dibatalkan oleh user
PR PREEMPETED Job dibatalkan oleh admin EFISON, alasan dikabarkan melalui email
S SUSPENDED Job ditahan oleh admin EFISON
6B Apabila user ingin membatalkan job, gunakan perintah scancel berdasarkan job ID.
  • Job ID dapat dilihat melalui perintah squeue pada kolom JOBID.
  • User hanya bisa membatalkan job submission milik user sendiri.
$ scancel <job-ID-submission-user>

Contoh user membatalkan job submission milik user dengan ID 231.

$ scancel 231

GUI Web - EFIRO Job Composer

Efirojobcomposer3.png

Menjalankan komputasi dengan tampilan grafis pada formulir job submission EFIRO Job Composer.

Langkah Menjalankan CP2K via EFIRO Job Composer
0 Sebelum login, user harus terhubung ke jaringan VPN ALELEON Supercomputer.
Buka alamat web http://aleleon.ood kemudian masukkan username dan password user.
  • Bagi user Linux, buka alamat http://10.192.50.11
1 Buka menu dashboard EFIRO Jobs > Jobs Composer

2 Pilih New Jobs > From Template

3
Pilih template DFTB+ yang diinginkan. Isi atau ganti Job Name sesuai keinginan user, kemudian klik Create New Job.
Template DFTB+ yang tersedia
Nama Template Penjelasan
DFTB+ 22.2 (CPU) Menjalankan DFTB+ 22.2 versi CPU
4 Jcjoboption3.png

File Input dftb_in.hsd

Gunakan menu Edit Files untuk upload / membuat file yang dibutuhkan termasuk file input.

  • Buat / upload file input DFTB+ dengan nama dan format dftb_in.hsd.
  • Laman Edit Files juga dapat melakukan view / download / edit / rename / delete file.
  • Fitur upload pada laman Edit Files mempunyai batasan ukuran upload 2GB per file.
    • Gunakan aplikasi FTP apabila user hendak mengupload file tunggal diatas 2GB.
5A

File Slaster-Koster (SK)

File input DFTB+ membutuhkan file Slater-Koster (SK) pada bagian Hamiltonian yang bisa didapatkan pada:

File dalam format .tar sehingga perlu di ekstrak.

5B Admin menyarankan untuk upload file SK pada direktori HOME melalui menu Files > Home Directory

Homedirefiro.png

Pastikan file input pada bagian Hamiltonian menunjuk direktori file SK spesifik pada HOME tersebut:

$HOME/<folder-file-SK-yang-dibutuhkan>
6

Menjalankan DFTB+

Melalui Open Editor, lengkapi Submit Script dengan mengganti bagian yang di tandai 4 garis miring (////).

  • Jangan lupa klik Save setiap sekali mengubah script.
  • Template ini bersifat referensi, user dapat mengubah bagian yang sekiranya perlu diubah.
Panduan nilai maks SBATCH untuk DFTB+1
Parameter SBATCH Fair policy usage2 Multi-node MPI3 High-mem node

epyc0014

ntasks (CPU) * cpus-per-task (OMP) 128 384 128
mem (RAM) 128GB 240GB 500GB
time (time limit) 3-00:00:00 atau 72:00:00
gpus (GPU) 2 0 0
Note:
  1. Info SBATCH lebih detail lihat laman Submit Script ALELEON Supercomputer
  2. Limitasi fair policy usage untuk menjaga kualitas layanan ALELEON Supercomputer.
  3. DFTB+ mendukung komputasi paralel MPI untuk berjalan multi-node lebih dari 128 core thread.
  4. User dapat menggunakan memori RAM hingga 500GB pada node epyc001 saja.
    • Tambahkan parameter #SBATCH --nodelist=epyc001
7A Jalankan job dengan klik tombol Submit.

Berikut penjelasan kolom Status, pantau dengan refresh halaman job:

Status Arti
Not Submitted Job belum pernah dijalankan.
Running Job berjalan.
Queue Job mengantri dan belum berjalan.
Completed Job selesai berjalan.
Failed Job berhenti di tengah jalan, bisa karena di Stop atau Delete oleh user.
7B Untuk menghentikan job yang tengah berjalan, klik tombol Stop.

Stop.png

8A Hasil output job dapat dilihat pada kolom Folder Contents atau membuka halaman Edit Pages.
User dapat melihat semua file output yang keluar di kolom Folder Contents.
atau dengan membuka menu Edit Files.
8B User dapat menjalankan ulang ruang job yang sama dengan mengklik kembali tombol Submit.

Notifikasi Status Jalannya Komputasi via email

SLURM ALELEON Supercomputer dapat mengirim notifikasi email kepada user dengan nama "Jojo" untuk mengabarkan status berjalannya job komputasi user. Silahkan tambahan SBATCH berikut pada SLURM Submit Script (dapat ditambahkan setelah SBATCH error) apabila user ingin menerima notifikasi email dari SLURM:

#SBATCH --mail-user=<alamat-email-user>
#SBATCH --mail-type=begin
#SBATCH --mail-type=end

Keterangan:

  • mail-user
    • Alamat email user untuk menerima notifikasi SLURM
  • mail-type=begin**Notifikasi email yang menginfokan job sudah berjalan.
  • mail-type=end
    • Notifikasi email yang menginfokan job sudah selesai.
    • Sekaligus memberikan cuplikan 20 baris terakhir dari file output SBATCH output dan error job user.

Pelaporan Kendala dan Support

Apabila menjumpai masalah teknis dalam menjalankan komputasi DFTB+, silahkan lapor dengan klik gambar berikut ini.

Wiki-pelaporankendala.jpg

---

Bila terdapat pertanyaan lainnya, silahkan hubungi admin EFISON melalui email:

support@efisonlt.com