CP2K

Dari ALELEON by EFISON

Revisi sejak 9 Januari 2024 09.14 oleh WilsonLisan (bicara | kontrib) (→‎Menggunakan terminal - SLURM sbatch: membuat format baru tabel menyiapkan data)

CP2K.png

CP2K adalah package untuk quantum chemistry dan solid state physics yang dapat melakukan simulasi liquid, molekolar, periodik, material, kristal, dan sistem biologis. CP2K menggunakan pemodelan DFT dengan pendekatan Gaussian and plane waves GPW dan GAPW.

Modul CP2K

Berikut adalah detail versi CP2K yang tersedia secara global di ALELEON Supercomputer:

Modul CP2K versi CPU
Versi Nama modul software Dukungan hardware
CPU GPU OMP

Threading

MPI

multi-node

9.1 cp2k/9.1-GCC10-MKL V - - V
Modul CP2K versi GPU (Modul ini sedang dalam tahap pengujian)
Versi Nama modul software Dukungan hardware
CPU GPU OMP

Threading

MPI

multi-node

9.1 cp2k/9.1-GCC10-MKL-CUDA V V - V

Menjalankan CP2K di Compute Node

User dapat menjalankan komputasi dengan pilihan cara melalui tampilan terminal atau GUI web EFIRO (klik expand atau kembangkan).

Menggunakan terminal - SLURM sbatch

Langkah Menjalankan CP2K di Terminal melalui SLURM sbatch

Sbatch Terminal.png

0
Login SSH

Tatacara login SSH lihat laman Login SSH ALELEON Supercomputer.

1
Menyiapkan File Komputasi

Siapkan file yang dibutuhkan untuk komputasi user, direkomendasikan dalam satu folder per job:

  • File input dan data komputasi.
    • User dapat upload / download file ke ALELEON dengan software FTP.
  • Membuat SLURM Submit Script yaitu 'formulir' untuk menjalankan job komputasi.
    • Nama script bebas dengan format file .sh (bash), contoh my_job_submission.sh
$ mkdir kerjaanskripsi
$ cd kerjaanskripsi
$ touch my_job_submission.sh

... upload / menyiapkan data input komputasi dll ...
2
Template SLURM Submit Script CP2K

Ikuti panduan template berikut dan petunjuk NOTES di dalamnya.

Template SLURM Submit Script untuk CP2K versi CPU
#!/bin/bash

# -----------------------------------------------------
# Template SLURM Submit Script
# CP2K (versi CPU) | rev.080124
# 
# NOTES: 
# 1. Isi bagian yang ditandai 4 garing (////).
# 2. Template ini bersifat referensi.
#    User dapat mengubah bagian yang perlu diubah.
# -----------------------------------------------------

# -----------------------------------------------------
# Alokasi komputasi SBATCH, input, dan module
# -----------------------------------------------------

# Alokasi jumlah core thread CPU
#SBATCH --ntasks=////

# Alokasi jumlah memori RAM (satuan GB)
#SBATCH --mem=////GB

# Alokasi limit waktu menjalankan job
# Format HH:MM:SS atau D-HH:MM:SS
#SBATCH --time=////

# Definisi file untuk menampung output terminal program
#SBATCH --output=result-%j.txt

# Definisi file untuk menampung output error log    
#SBATCH --error=error-%j.txt 

# Nama input file CP2K yang dijalankan
INPUT_FILE="////.inp"

# Memuat modul software CP2K versi CPU
# Daftar modul lihat subbab "Modul CP2K" di atas 
module load cp2k////

# ----------------------------------------------------
# Script jalannya program
# ----------------------------------------------------

# Perintah menjakankan CP2K
mpirun -np ${SLURM_NTASKS} --mca pml ucx --mca osc ucx cp2k.zen2 ${INPUT_FILE}
Template SLURM Submit Script untuk CP2K versi GPU
#!/bin/bash

# -----------------------------------------------------
# Template SLURM Submit Script
# CP2K (versi GPU) | rev.080124
# 
# NOTES: 
# 1. Isi bagian yang ditandai 4 garing (////).
# 2. Template ini bersifat referensi.
#    User dapat mengubah bagian yang perlu diubah.
# 3. Jumlah ntasks dan gpu berdasarkan doc CP2K
#    Menggunakan rate komputasi 9 CCH/jam & 1 GH/jam
# -----------------------------------------------------

# -----------------------------------------------------
# Alokasi komputasi SBATCH, input, dan module
# -----------------------------------------------------

# Menggunakan partisi compute node GPU
#SBATCH --partition=ampere

# Alokasi jumlah core thread CPU
#SBATCH --ntasks=9

# Alokasi jumlah GPU
#SBATCH --gpus=1

# Alokasi jumlah memori RAM (satuan GB)
#SBATCH --mem=64GB

# Alokasi limit waktu menjalankan job
# Format HH:MM:SS atau D-HH:MM:SS
#SBATCH --time=////

# Definisi file untuk menampung output terminal program
#SBATCH --output=result-%j.txt

# Definisi file untuk menampung output error log    
#SBATCH --error=error-%j.txt 

# Nama input file CP2K yang dijalankan
INPUT_FILE="////.inp"

# Memuat modul software CP2K versi GPU
# Daftar modul lihat subbab "Modul CP2K" di atas 
module load cp2k////

# ----------------------------------------------------
# Script jalannya program
# ----------------------------------------------------

# Unset UCX supaya MPI berjalan di NVIDIA
unset UCX_TLS
unset UCX_NET_DEVICES

# Perintah menjakankan CP2K
mpirun -np ${SLURM_NTASKS} --mca pml ucx --mca osc ucx cp2k.zen2 ${INPUT_FILE}
Panduan Nilai Maksimal SBATCH
Panduan Nilai Maksimal SBATCH ntasks, mem, gpus, time
Skenario Komputasi Nilai maksimal SBATCH
ntasks

(CPU)

mem

(RAM)

gpus

(GPU)

time

(time limit)

Fair policy usage untuk akumulasi semua job1 128 128GB 2 3-00:00:00

atau 72:00:00

CP2K versi CPU2 384 240GB2 0
CP2K versi CPU di high-mem node3 128 500GB 0
CP2K versi GPU4 9 64GB 1
Keterangan:
  1. Limitasi fair policy usage untuk menjaga kualitas layanan ALELEON Supercomputer.
  2. CP2K mendukung komputasi paralel MPI (multi-node):
    • Pada jumlah ntasks >128, SLURM otomatis menjalankan job multi-node.
      • Dalam kaitan ini, parameter mem adalah alokasi memori RAM per-node.
    • Info lebih detail lihat laman MPI ALELEON Supercomputer.
  3. User dapat mengalokasikan RAM hingga 500GB pada high-mem node.
    • Tambahkan parameter #SBATCH --nodelist=epyc001
  4. Nilai maks versi GPU berdasarkan rekomendasi dokumentasi CP2K.
Keterangan tambahan
  • Sisa Core Hour pada akun perseorangan menentukan besar ntasks, gpus, dan time:
    • SLURM akan menahan job apabila:
      • ntasks * time (jam) lebih besar dari sisa CPU Core Hour user.
      • gpus * time (jam) lebih besar dari sisa GPU Hour user.
    • Cek sisa Kredit Core Hour melalui perintah sausage:
$ sausage
3
Menjalankan Job Komputasi

Jalankan job dengan perintah sbatch.

$ sbatch <nama-SLURM-Submit-script>

Contoh menjalankan nama script my_job_submission.sh.

$ sbatch my_job_submission.sh
4A User dapat melihat status jalannya job dengan perintah squeue berikut.
  • Apabila tidak ada output artinya tidak ada job user yang berjalan / antri pada waktu itu.
$ squeue -ul $USER

Berikut adalah daftar STATE (ST) dari squeue yang menunjukkan status berjalannya job:

Daftar STATE squeue SLURM
STATE Kepanjangan Penjelasan
R RUN Job berjalan
PD PENDING Job tertahan, lihat keterangan NODELIST(REASON)
CG COMPLETING Job selesai dan dalam proses clean-up SLURM
CA CANCELED Job dibatalkan oleh user
PR PREEMPETED Job dibatalkan oleh admin EFISON, alasan dikabarkan melalui email
S SUSPENDED Job ditahan oleh admin EFISON
4B
Menghentikan Job Komputasi

Apabila user ingin membatalkan job, gunakan perintah scancel berdasarkan job ID.

  • Job ID dapat dilihat melalui perintah squeue pada kolom JOBID.
  • User hanya bisa membatalkan job submission milik user sendiri.
$ scancel <job-ID-submission-user>

Contoh user membatalkan job submission milik user dengan ID 231.

$ scancel 231

Menggunakan Web EFIRO - EFIRO Job Composer

Langkah Menjalankan CP2K via EFIRO Job Composer

Efirojobcomposer3.png

0
Login Web EFIRO

Sebelum login, user harus terhubung ke jaringan VPN ALELEON Supercomputer.

Buka alamat web http://aleleon.ood kemudian masukkan username dan password user.
  • Bagi user Linux, buka alamat http://10.192.50.11
1 Buka menu dashboard EFIRO Jobs > Jobs Composer

2
Memilih Template Job

Pilih New Jobs > From Template

3
Pilih template CP2K yang diinginkan. Isi atau ganti Job Name sesuai keinginan user, kemudian klik Create New Job.
Template CP2K yang tersedia
Nama Template Penjelasan
CP2K 9.1 (CPU) Menjalankan CP2K versi 9.1 di CPU
CP2K 9.1 (GPU) Eksperimental Menjalankan CP2K versi 9.1 di GPU. Dalam fase pengujian
4 Jcjoboption3.png
Menyiapkan File Komputasi

Gunakan menu Edit Files untuk upload file yang dibutuhkan.

  • Laman Edit Files juga dapat melakukan view / download / edit / rename / delete file.
  • Fitur upload pada laman Edit Files mempunyai batasan ukuran upload 2GB per file.
    • Gunakan aplikasi FTP apabila user hendak mengupload file tunggal diatas 2GB.
5A

Melalui Open Editor, lengkapi Submit Script dengan mengganti bagian yang di tandai 4 garis miring (////).

  • Jangan lupa klik Save setiap sekali mengubah script.
  • Template ini bersifat referensi, user dapat mengubah bagian yang sekiranya perlu diubah.
5B
Panduan Nilai Maksimal SBATCH
Panduan Nilai Maksimal SBATCH ntasks, mem, gpus, time
Skenario Komputasi Nilai maksimal SBATCH
ntasks

(CPU)

mem

(RAM)

gpus

(GPU)

time

(time limit)

Fair policy usage untuk akumulasi semua job1 128 128GB 2 3-00:00:00

atau 72:00:00

CP2K versi CPU2 384 240GB 0
CP2K versi CPU di high-mem node3 128 500GB 0
CP2K versi GPU4 9 64GB 1
Keterangan:
  1. Limitasi fair policy usage untuk menjaga kualitas layanan ALELEON Supercomputer.
  2. CP2K mendukung komputasi paralel MPI (multi-node):
    • Pada jumlah ntasks >128, SLURM otomatis menjalankan job multi-node.
      • Dalam kaitan ini, parameter mem adalah alokasi memori RAM per-node.
    • Info lebih detail lihat laman MPI ALELEON Supercomputer.
  3. User dapat mengalokasikan RAM hingga 500GB pada high-mem node.
    • Tambahkan parameter #SBATCH --nodelist=epyc001
  4. Nilai maks versi GPU berdasarkan rekomendasi dokumentasi CP2K.
Info SBATCH lebih detail lihat laman Submit Script ALELEON Supercomputer
Sisa Kredit Core Hour pada akun perseorangan menentukan besar ntasks, gpus, dan time:
  • SLURM akan menahan job apabila:
    • ntasks * time (jam) lebih besar dari sisa CPU Core Hour user.
    • gpus * time (jam) lebih besar dari sisa GPU Hour user.
  • Cek sisa Kredit Core Hour melalui menu Open Terminal dan jalankan perintah sausage:
$ sausage

Jcjoboption4.png

6A
Menjalankan Job Komputasi

Jalankan job dengan klik tombol Submit.

Berikut penjelasan kolom Status, pantau dengan refresh halaman job:

Status Arti
Not Submitted Job belum pernah dijalankan.
Running Job berjalan.
Queue Job mengantri dan belum berjalan.
Completed Job selesai berjalan.
Failed Job berhenti di tengah jalan, bisa karena di Stop atau Delete oleh user.
6B
Menghentikan Job Komputasi

Untuk menghentikan job yang tengah berjalan, klik tombol Stop.

Stop.png

7A
Melihat Output Komputasi
Hasil output job dapat dilihat pada kolom Folder Contents atau membuka halaman Edit Files.
User dapat melihat semua file output yang keluar di kolom Folder Contents.
atau dengan membuka menu Edit Files.
7B User dapat menjalankan ulang ruang job yang sama dengan mengklik kembali tombol Submit.

Notifikasi Status Jalannya Komputasi via email

SLURM ALELEON Supercomputer dapat mengirim notifikasi email kepada user dengan nama "Jojo" untuk mengabarkan status berjalannya job komputasi user. Silahkan tambahan SBATCH berikut pada Submit Script apabila user ingin menerima notifikasi email dari SLURM:

#SBATCH --mail-user=<alamat-email-user> 
#SBATCH --mail-type=BEGIN,END,FAIL

SBATCH mail-type mengatur konten email notifikasi SLURM dengan pilihan opsi yang sekiranya berguna untuk user:

  • BEGIN -> notifikasi job sudah mulai
  • END -> notifikasi job sudah selesai beserta cuplikan 20 baris terakhir dari file SBATCH output dan error.
  • FAIL -> notifikasi apabila job gagal berjalan atau berhenti tidak sewajarnya.
  • TIME_LIMIT_50 -> job telah berjalan dengan durasi waktu 50% time limit.
  • TIME_LIMIT_80 -> job telah berjalan dengan durasi waktu 80% time limit.

Pelaporan Kendala dan Support

Apabila menjumpai masalah teknis dalam menjalankan komputasi CP2K, silahkan lapor dengan klik gambar berikut ini.

Wiki-pelaporankendala.jpg

---

Bila terdapat pertanyaan lainnya, silahkan hubungi admin EFISON melalui email:

support@efisonlt.com