Anaconda adalah suite katalog packages Python dan R untuk komputasi data science dan machine learning.
Modul Anaconda Python
Berikut adalah detail versi Anaconda yang tersedia secara global di ALELEON Supercomputer dimana menggunakan Python 3 sebagai standar.
Modul Anaconda
Versi
|
Nama modul
|
Versi Python
default
|
Dukungan hardware
|
CPU
|
GPU
|
OMP
Threading
|
MPI
multi-node
|
Anaconda 3 2020.11
|
Anaconda3/2020.11
|
3.8.5
|
V
|
V
|
V1
|
V2
|
Anaconda 3 2021.05
|
Anaconda3/2021.05
|
3.8.8
|
Anaconda 3 2022.05
|
Anaconda3/2022.05
atau Anaconda3
|
3.9.12
|
Keterangan:
- Melalui package Python yang mendukung OpenMP seperti Cython, Numba, Pythran, PyPy, dll.
- Melalui MPI for Python (MPI4PY)
Modul NVIDIA CUDA Toolkit
User membutuhkan modul NVIDIA CUDA Toolkit untuk menjalankan Python dengan akselerasi GPU NVIDIA. Berikut adalah detail versi NVIDIA CUDA Toolkit yang tersedia secara global di ALELEON Supercomputer.
Modul NVIDIA CUDA Toolkit
Nama dan Versi
|
Nama Modul
|
CUDA 11.2 dengan cuDNN 8.1.1
|
cuda/11.2-cuDNN8.1.1
|
CUDA 11.6 dengan cuDNN 8.3.3
|
cuda/11.6-cuDNN8.3.3
|
CUDA 11.8 dengan cuDNN 8.6.0
|
cuda/11.8-cuDNN8.6.0
|
CUDA 12.0 dengan cuDNN 8.7.0
|
cuda/12.0-cuDNN8.7.0
|
CUDA 12.1 dengan cuDNN 8.8.1
|
cuda/12.1-cuDNN8.8.1
atau cuda
|
Apabila user membutuhkan CUDA versi spesifik yang belum ada di atas, hubungi tim admin melalui support@efisonlt.com untuk permintaan instalasi. Layanan ini bebas biaya dan akan dilakukan pada hari dan jam kerja EFISON.
Membuat Conda Environment dan Instalasi Package Python
ALELEON Supercomputer mensyaratkan user membuat Conda Environment untuk menjalankan komputasi Python via Anaconda.
- Conda Environment adalah 'ruang isolasi' untuk instalasi package Python masing-masing user.
- User membuat Conda Environment dan melakukan instalasi package Python secara mandiri.
- Kegiatan ini tidak mengkonsumsi Kredit Core Hour.
Berikut adalah langkah membuat Conda Environment di ALELEON Supercomputer:
Membuat Conda Environment
|
0
|
Instalasi package dilakukan melalui terminal.
- Bagi user yang login ke web EFIRO, buka menu
Clusters > Aleleon Shell Access .
|
1
|
Aktifkan modul Anaconda, disarankan menggunakan Anaconda terbaru:
$ module load Anaconda3
Apabila ingin menggunakan versi Anaconda lainnya, lihat subbab Modul Anaconda.
|
2
|
Membuat Conda Environment
Buat Conda Environment secara default di direktori HOME dengan format perintah:
$ conda create --name <nama-conda-environment> pip
Contoh:
$ conda create --name kerjaanskripsi pip
|
3
|
Mengaktifkan Conda Environment dan Instalasi Package Python
Aktifkan Conda Environment dengan format berikut:
$ source activate $CONDA/<nama-conda-environment
Contoh:
$ source activate $CONDA/kerjaanskripsi
Conda Environment aktif ditandai dengan tulisan nama env pada bash terminal seperti ini:
(kerjaanskripsi) [wololo@login ~]$
Lakukan instalasi package Python (contoh Tensorflow, PyTorch) yang dibutuhkan dengan pip
(kerjaanskripsi) $ pip install <nama-package-Python>
Instal package jupyter bagi user yang ingin menggunakan sesi interaktif Jupyter
(kerjaanskripsi) $ pip install jupyter
(kerjaanskripsi) $ pip install jupyterlab
|
Menonaktifkan Conda Environment
User dapat menonaktifkan Conda Environment yang sedang aktif dengan perintah:
$ conda deactivate
Mengaktifkan Kembali Conda Environment User
User dapat kembali mengaktifkan Conda Environment yang dibuat dengan langkah 1 dan 3 diatas:
$ module load Anaconda3
$ source activate $CONDA/<nama-conda-environment>
User dapat melihat daftar nama Conda Environment yang sebelumnya dibuat dengan perintah
$ conda-env list
Menghapus Conda Environment
User dapat menghapus Conda Environment dengan format perintah:
$ conda remove -n <nama-conda-environment> --all
|
Alternatif Menjalankan Anaconda Python di ALELEON Supercomputer
ALELEON Supercomputer menawarkan user untuk menjalankan Anaconda Python dengan pilihan skema:
Menjalankan Anaconda Python Melalui Job Submission
User dapat menjalankan komputasi dengan pilihan cara melalui tampilan terminal atau website EFIRO (klik expand atau kembangkan).
Menggunakan terminal (SLURM sbatch)
Langkah Menjalankan Anaconda Python di Terminal
|
0
|
Login SSH
Tatacara login SSH lihat laman Login SSH ALELEON Supercomputer.
|
1
|
Menyiapkan File Komputasi
Siapkan file yang dibutuhkan untuk komputasi user, rekomendasi dalam satu folder per job:
- File input dan data komputasi.
- User dapat upload / download file ke ALELEON dengan software FTP.
- Membuat SLURM Submit Script yaitu 'formulir' untuk menjalankan job komputasi.
- Nama script bebas dengan format file .sh (bash), contoh
my_job_submission.sh
$ mkdir kerjaanskripsi
$ cd kerjaanskripsi
$ touch my_job_submission.sh
... upload / menyiapkan data input komputasi dll ...
|
2
|
Template SLURM Submit Script Anaconda Python
Ikuti panduan template berikut dan petunjuk NOTES di dalamnya.
Template SLURM Submit Script untuk Anaconda Python versi CPU
|
#!/bin/bash
# -----------------------------------------------------
# Template SLURM Submit Script
# Anaconda Python (CPU)
#
# NOTES:
# 1. Isi bagian yang ditandai 4 garing (////).
# 2. Template ini bersifat referensi.
# User dapat mengubah bagian yang perlu diubah.
# 3. Pastikan user sudah membuat Conda Environment.
# -----------------------------------------------------
# -----------------------------------------------------
# Alokasi komputasi SBATCH dan file input
# -----------------------------------------------------
# Alokasi jumlah core thread CPU
#SBATCH --ntasks=////
# Alokasi jumlah memori RAM (satuan GB)
#SBATCH --mem=////GB
# Alokasi limit waktu menjalankan job
# Format HH:MM:SS atau D-HH:MM:SS
#SBATCH --time=////
# Definisi file untuk menampung output terminal program
#SBATCH --output=result-%j.txt
# Definisi file untuk menampung output error log
#SBATCH --error=error-%j.txt
# Nama Conda Environment yang digunakan
CONDA_NAME=////
# Nama program Python yang dijalankan
INPUT_FILE=////.py
# ----------------------------------------------------
# Script jalannya program
# ----------------------------------------------------
# Mengaktifkan Conda Environment
module load Anaconda3
source activate ${CONDA}/${CONDA_NAME}
# Menjalankan file Python
python3 ${INPUT_FILE}
|
Template SLURM Submit Script untuk Anaconda Python versi GPU
|
#!/bin/bash
# -----------------------------------------------------
# Template SLURM Submit Script
# Anaconda Python (GPU)
#
# NOTES:
# 1. Isi bagian yang ditandai 4 garing (////).
# 2. Template ini bersifat referensi.
# User dapat mengubah bagian yang perlu diubah.
# 3. Pastikan user sudah membuat Conda Environment.
# -----------------------------------------------------
# -----------------------------------------------------
# Alokasi komputasi SBATCH dan file input
# -----------------------------------------------------
# Menggunakan partisi compute node GPU
#SBATCH --partition=ampere
# Alokasi jumlah core thread CPU
#SBATCH --ntasks=////
# Alokasi jumlah GPU
#SBATCH --gpus=////
# Alokasi jumlah memori RAM (satuan GB)
#SBATCH --mem=////GB
# Alokasi limit waktu menjalankan job
# Format HH:MM:SS atau D-HH:MM:SS
#SBATCH --time=////
# Definisi file untuk menampung output terminal program
#SBATCH --output=result-%j.txt
# Definisi file untuk menampung output error log
#SBATCH --error=error-%j.txt
# Nama Conda Environment yang digunakan
CONDA_NAME=////
# Nama program Python yang dijalankan
INPUT_FILE=////.py
# ----------------------------------------------------
# Script jalannya program
# ----------------------------------------------------
# Memuat modul NVIDIA CUDA default
module load cuda
# Mengaktifkan Conda Environment
module load Anaconda3
source activate ${CONDA}/${CONDA_NAME}
# Menjalankan file Python
python3 ${INPUT_FILE}
|
|
=====Panduan Nilai Maksimal SBATCH=====
Panduan Nilai Maksimal SBATCH ntasks, mem, gpus, time
|
Skenario Komputasi
|
ntasks
(CPU)
|
mem
(RAM)
|
gpus
(GPU)
|
time
(time limit)
|
Fair policy usage untuk akumulasi semua job1
|
128
|
128GB
|
2
|
3-00:00:00
atau
72:00:00
|
Python versi CPU
|
128
|
240GB
|
0
|
Python versi CPU di high-mem node
- Tambahkan
#SBATCH --nodelist=epyc001
|
128
|
500GB
|
0
|
Python versi GPU
|
32
|
120GB
|
2
|
Python versi MPI (MPI4PY)2
|
384
|
240GB2
|
0
|
Keterangan:
- Limitasi untuk menjaga kualitas layanan ALELEON Supercomputer.
- MPI4PY mendukung komputasi paralel MPI. Ketika jumlah ntasks lebih dari 128:
- SLURM otomatis menjalankan job pada multi-node.
- Parameter mem adalah alokasi memori RAM per-node.
- Info detail buka laman MPI ALELEON Supercomputer.
|
Keterangan tambahan
|
- Untuk akun perseorangan dengan Kredit Core Hour:
- SLURM akan menahan job apabila:
- ntasks * time (jam) lebih besar dari sisa CPU Core Hour user.
- gpus * time (jam) lebih besar dari sisa GPU Hour user.
- Cek sisa Kredit Core Hour melalui perintah:
$ sausage
|
|
3
|
Menjalankan Job Komputasi
Jalankan job dengan perintah sbatch.
$ sbatch <nama-SLURM-Submit-script>
Contoh menjalankan nama script my_job_submission.sh .
$ sbatch my_job_submission.sh
|
4A
|
User dapat melihat status jalannya job dengan perintah squeue berikut.
- Apabila tidak ada output artinya tidak ada job user yang berjalan / antri pada waktu itu.
$ squeue -ul $USER
Berikut adalah daftar STATE (ST) dari squeue yang menunjukkan status berjalannya job:
Daftar STATE squeue SLURM
STATE
|
Kepanjangan
|
Penjelasan
|
R
|
RUN
|
Job berjalan
|
PD
|
PENDING
|
Job tertahan, lihat keterangan NODELIST(REASON)
|
CG
|
COMPLETING
|
Job selesai dan dalam proses clean-up SLURM
|
CA
|
CANCELED
|
Job dibatalkan oleh user
|
PR
|
PREEMPETED
|
Job dibatalkan oleh admin EFISON, alasan dikabarkan melalui email
|
S
|
SUSPENDED
|
Job ditahan oleh admin EFISON
|
|
4B
|
Menghentikan Job Komputasi
Apabila user ingin membatalkan job, gunakan perintah scancel berdasarkan job ID.
- Job ID dapat dilihat melalui perintah squeue pada kolom JOBID.
- User hanya bisa membatalkan job submission milik user sendiri.
$ scancel <job-ID-submission-user>
Contoh user membatalkan job submission milik user dengan ID 231.
$ scancel 231
|
Menggunakan Web EFIRO (EFIRO Job Composer)
Langkah Menjalankan Anaconda Python di Web EFIRO
|
0
|
Login Web EFIRO
|
1
|
Membuka Job Composer dan Memilih Template Job
- Buka menu
Jobs > Jobs Composer pada dashboard EFIRO.
- Pilih
New Job > From Template
Menu Jobs > Jobs Composer Menu New Jobs > From Template
|
2
|
- PIlih template Anaconda Python yang diinginkan.
- Isi atau ganti kolom
Job Name sesuai keinginan user.
- Apabila sudah selesai, klik
Create New Job .
Template Anaconda Python yang tersedia
|
Nama Template
|
Penjelasan
|
Anaconda Python (CPU)
|
Menjalankan Anaconda Python versi CPU
|
Anaconda Python (GPU)
|
Menjalankan Anaconda Python versi GPU
|
|
3
|
Menyiapkan File Komputasi
Gunakan menu Edit Files untuk upload file komputasi yang dibutuhkan.
- Laman Edit Files juga dapat melakukan download / edit / rename / delete file.
- Fitur upload pada Edit Files mempunyai limit kapasitas 2GB per file.
|
4
|
Melengkapi Submit Script
Submit Script adalah "formulir" untuk menjalankan job komputasi user.
- Lengkapi Submit Script melalui menu
Open Editor .
- Ikuti petunjuk NOTES di dalamnya.
- Jangan lupa klik
Save setiap sekali mengubah script.
|
Panduan Nilai Maksimal SBATCH
Panduan Nilai Maksimal SBATCH ntasks, mem, gpus, time
|
Skenario Komputasi
|
ntasks
(CPU)
|
mem
(RAM)
|
gpus
(GPU)
|
time
(time limit)
|
Fair policy usage untuk akumulasi semua job1
|
128
|
128GB
|
2
|
3-00:00:00
atau
72:00:00
|
Python versi CPU
|
128
|
240GB
|
0
|
Python versi CPU di high-mem node
- Tambahkan
#SBATCH --nodelist=epyc001
|
128
|
500GB
|
0
|
Python versi GPU
|
32
|
120GB
|
2
|
Python versi MPI (MPI4PY)2
|
384
|
240GB2
|
0
|
Keterangan:
- Limitasi untuk menjaga kualitas layanan ALELEON Supercomputer.
- MPI4PY mendukung komputasi paralel MPI. Ketika jumlah ntasks lebih dari 128:
- SLURM otomatis menjalankan job pada multi-node.
- Parameter mem adalah alokasi memori RAM per-node.
- Info detail buka laman MPI ALELEON Supercomputer.
|
- Untuk akun perseorangan dengan Kredit Core Hour:
- SLURM akan menahan job apabila:
- ntasks * time (jam) lebih besar dari sisa CPU Core Hour user.
- gpus * time (jam) lebih besar dari sisa GPU Hour user.
- Cek sisa Kredit Core Hour melalui menu
Open Terminal dan jalankan perintah:
$ sausage
|
|
5
|
===== Menjalankan Job Komputasi =====
Jalankan job dengan klik tombol Submit .
Penjelasan kolom Status , pantau dengan refresh halaman job
Status
|
Arti
|
Not Submitted
|
Job belum pernah dijalankan.
|
Running
|
Job berjalan.
|
Queue
|
Job mengantri dan belum berjalan.
|
Completed
|
Job selesai berjalan.
|
Failed
|
Job berhenti di tengah jalan, bisa karena di Stop atau Delete oleh user.
|
Menghentikan Job Komputasi
Untuk menghentikan job yang tengah berjalan, klik tombol Stop .
|
6A
|
Melihat Output Komputasi
User dapat melihat output file komputasi pada kolom Folder Contents
- Atau dengan membuka
Edit Files
|
6B
|
User dapat menjalankan ulang ruang job yang sama dengan mengklik kembali tombol Submit .
|
Notifikasi Status Jalannya Komputasi via email
SLURM ALELEON Supercomputer dapat mengirim notifikasi email kepada user dengan nama "Jojo" untuk mengabarkan status berjalannya job komputasi user. Silahkan tambahan SBATCH berikut pada Submit Script apabila user ingin menerima notifikasi email dari SLURM:
#SBATCH --mail-user=<alamat-email-user>
#SBATCH --mail-type=BEGIN,END,FAIL
SBATCH mail-type mengatur konten email notifikasi SLURM dengan pilihan opsi yang sekiranya berguna untuk user:
- BEGIN -> notifikasi job sudah mulai
- END -> notifikasi job sudah selesai beserta cuplikan 20 baris terakhir dari file SBATCH output dan error.
- FAIL -> notifikasi apabila job gagal berjalan atau berhenti tidak sewajarnya.
- TIME_LIMIT_50 -> job telah berjalan dengan durasi waktu 50% time limit.
- TIME_LIMIT_80 -> job telah berjalan dengan durasi waktu 80% time limit.
Menjalankan Anaconda Python dengan Sesi Interaktif Jupyter
Terdapat 2 langkah untuk menjalankan sesi interaktif Jupyter dengan Conda Environment User yaitu:
- Melakukan instalasi pip Jupyter pada Conda Environment yang akan digunakan untuk sesi Jupyter.
- Memulai sesi interaktif Jupyter Notebook atau Lab pada web EFIRO.
---
Instalasi pip Jupyter pada Conda Environment
Berikut adalah langkah instalasi pip Jupyter pada Conda Environment user (klik expand atau kembangkan):
Langkah Instalasi pip Jupyter pada Conda Environment User
|
0
|
Instalasi package dilakukan melalui terminal.
- Bagi user yang login ke web EFIRO, buka menu
Clusters > Aleleon Shell Access .
|
1
|
Aktifkan Conda Environment yang akan digunakan untuk sesi Jupyter
$ module load Anaconda3
$ source activate $CONDA/<nama-conda-environment>
|
2
|
Lakukan pip install jupyter dan jupyterlab
$ pip install jupyter
$ pip install jupyterlab
|
---
Memulai Sesi Jupyter
Berikut adalah langkah untuk memulai sesi Jupyter dengan Conda Environment yang dibuat user (klik expand atau kembangkan):
Langkah Memulai Sesi Interaktif Jupyter
|
0
|
Login Web EFIRO
|
1
|
Buka menu Interactive Apps
- Silahkan pilih Jupyter Notebook atau Lab sesuai referensi pribadi user.
|
3
|
Mengisi Formulir Sesi Interaktif Jupyter
Isi formulir untuk memulai sesi Jupyter dengan panduan berikut:
Panduan Formulir Menggunakan Torti (Interactive Node CPU)
|
- Partition -> torti
- Number of CPU Cores -> Min: 1, maks: 32
- Number of GPUs -> kosongkan
- Number of hours (Durasi sesi interaktif) -> Min: 1, maks: 72
- Anaconda Selection -> Pilih versi terbaru
- Conda Environment Directory
- Alamat direktori Conda Environment user, isi dengan format:
$CONDA/<nama-conda-environment>
- Software Modules -> kosongkan
- Environment Setup -> kosongkan
- Email Address
- Sistem mengirim notifikasi ke email user ketika sesi Jupyter siap diakses.
- Apabila butuh, isi dengan email user
|
Panduan Formulir Menggunakan Tilla (Interactive Node GPU)
|
- Partition -> tilla
- Number of CPU Cores -> Min: 1, maks: 32
- Number of GPUs -> 1
- Number of hours (Durasi sesi interaktif) -> Min: 1, maks: 72
- Anaconda Selection -> Pilih versi terbaru
- Conda Environment Directory
- Alamat direktori Conda Environment user, isi dengan format:
$CONDA/<nama-conda-environment>
- Software Modules
- Masukkan nama modul NVIDIA CUDA. Terdapat dua alternatif:
- Environment Setup -> kosongkan
- Email Address
- Sistem mengirim notifikasi ke email user ketika sesi Jupyter siap diakses.
- Apabila butuh, isi dengan email user
|
Perhatian: Sesi Jupyter tidak akan berjalan apabila:
- Number of CPU cores * Number of Hour lebih besar dari sisa CPU Core Hour user.
- Number of GPUs * Number of Hour lebih besar dari sisa GPU Hour user.
Cek sisa Kredit Core Hour user dengan langkah:
- Buka
Clusters > Aleleon Shell Access pada dasboard EFIRO.
$ sausage
|
|
4
|
Memulai Sesi Interaktif Jupyter
Apabila formulir sudah terisi, klik tombol Launch untuk memulai sesi Jupyter.
- User akan diarahkan ke halaman
My Interactive Sessions .
- Tunggu hingga sesi Jupyter siap diakses.
Status sesi Jupyter mengantri menunggu alokasi hardware
|
5
|
Apabila status menunjukkan Running atau kolom berwarna hijau, klik Connect to Jupyter .
- Sistem mulai menghitung Core Hour saat status sesi Jupyter menunjukkan running.
Sesi Jupyter siap diakses.
|
6
|
Pilih Notebook Python 3 untuk memulai sesi notebook Python 3 baik di Jupyter Notebook dan Lab. Gunakan Notebook Python 3 untuk menjalankan kernel Conda Environment user di Jupyter Notebook Gunakan Notebook Python 3 untuk menjalankan kernel Conda Environment user di Jupyter Lab
|
7A
|
Mengakses Kembali Sesi Interaktif Jupyter yang Berjalan
User dapat mengunjungi sesi Jupyter yang sedang berjalan di My Interactive Sessions
|
7B
|
Menghentikan Sesi Interaktif Jupyter
User dapat menghentikan sesi Jupyter yang sedang berjalan dengan klik tombol Delete Klik tombol Delete untuk menghentikan sesi Jupyter yang sedang berjalan
|
Pelaporan Kendala dan Support
Apabila menjumpai masalah teknis dalam menjalankan komputasi, silahkan lapor dengan klik gambar berikut ini.
---
Bila terdapat pertanyaan lainnya, silahkan hubungi admin EFISON melalui email:
support@efisonlt.com