R

Dari ALELEON by EFISON

R.png

R adalah bahasa interpreter yang didesain untuk mengerjakan komputasi statistika. Pada perkembangannya, bahasa R digunakan untuk pengolahan data di bidang data science. Software R didukung oleh The R Foundation for Statistical Computing.

Modul R

Berikut adalah detail versi R yang tersedia secara global di ALELEON Supercomputer:

Modul R
Versi Nama modul Dukungan hardware
CPU GPU OMP

Threading

MPI

multi-node

4.3.0 "Already Tomorrow" R/4.3.0-GCC11.3-MKL V - - V melalui RMPI1

Keterangan:

  1. RMPI dapat dicapai dengan pemrograman R dari pihak user menggunakan wrapper Rmpi.

Instalasi Library Package R

Instalasi library R pada ALELEON Supercomputer dapat dilakukan dengan dua alternatif cara:

  1. Melayangkan permintaan instalasi package ke admin melalui email support@efisonlt.com; atau
  2. Melakukan instalasi mandiri di Login Node dengan langkah berikut (klik expand atau kembangkan):
Langkah instalasi mandiri Library Package R di Login Node

*tidak menggunakan Kredit Core Hour

0 Instalasi package dilakukan melalui terminal.
  • Bagi user yang login ke web EFIRO, buka menu Clusters > Aleleon Shell Access.

Shellaccess.png

1 Aktifkan R dengan memuat modul versi R yang akan digunakan.
Versi Perintah Terminal
4.3.0 $ module load R/4.3.0-GCC11.3-MKL
2 Jalankan R dan lakukan instalasi package dengan format perintah standar:
$ R 
> install.packages('nama-package-yang-akan-diinstal')

Package akan terinstal di direktori HOME user.

Bagi user yang pertama kali melakukan instalasi package R:

Akan terdapat prompt untuk mengarahkan instalasi ke personal library, jawab yes.

Warning in install.packages("benchmarkme") :
  'lib = "/comp/R/4.1.2-GCC10-MKL/lib64/R/library"' is not writable
Would you like to use a personal library instead? (yes/No/cancel) yes

Kemudian R akan meminta izin untuk membuat personal library di HOME user. Jawab yes.

Would you like to create a personal library
‘~/R/x86_64-pc-linux-gnu-library/4.1’
to install packages into? (yes/No/cancel) yes

Alternatif Menjalankan R di ALELEON Supercomputer

ALELEON Supercomputer menawarkan user untuk menjalankan R dengan pilihan skema:

Efirojobcomposer3.png
---

Menjalankan R melalui Job Submission

  • Menjalankan file R siap jalan melalui scheduler SLURM.
  • Berjalan di Compute Node:
    • Dengan alokasi hingga CPU 128 core dan RAM 500GB
    • R versi MPI (RMPI) dapat berjalan paralel hingga CPU 384 core.
Efirojupyterlab.png

Menjalankan R dengan sesi interaktif Jupyter

  • Menjalankan R melalui sesi interaktif via Jupyter Notebook atau Lab.
  • Berjalan di Interactive Node:
    • Torti dengan spesifikasi CPU 32 core dan RAM 64GB.

Menjalankan R Melalui Job Submission

User dapat menjalankan komputasi dengan pilihan cara melalui tampilan terminal atau website EFIRO (klik expand atau kembangkan).

Opsi menggunakan terminal (SLURM sbatch)

Langkah Menjalankan R di Terminal

Sbatch Terminal.png

0
Login SSH

Tatacara login SSH lihat laman Login SSH ALELEON Supercomputer.

1
Menyiapkan File Komputasi dan Library Package R

Siapkan file yang dibutuhkan untuk komputasi user, rekomendasi dalam satu folder per job:

  • File input dan data komputasi.
    • User dapat upload / download file ke ALELEON dengan software FTP.
  • Membuat SLURM Submit Script yaitu 'formulir' untuk menjalankan job komputasi.
    • Nama script bebas dengan format file .sh (bash), contoh my_job_submission.sh
  • Lakukan instalasi library package R yang dibutuhkan job komputasi user
2
Template SLURM Submit Script R

Ikuti panduan template berikut dan petunjuk NOTES di dalamnya.

Template SLURM Submit Script untuk R
#!/bin/bash

# -----------------------------------------------------
# Template SLURM Submit Script
# R | rev.080124
# 
# NOTES: 
# 1. Isi bagian yang ditandai 4 garing (////).
# 2. Template ini bersifat referensi.
#    User dapat mengubah bagian yang perlu diubah.
# -----------------------------------------------------

# -----------------------------------------------------
# Alokasi komputasi SBATCH, input, dan module
# -----------------------------------------------------

# Alokasi jumlah core thread CPU
#SBATCH --ntasks=////

# Alokasi jumlah memori RAM (satuan GB)
#SBATCH --mem=////GB

# Alokasi limit waktu menjalankan job
# Format HH:MM:SS atau D-HH:MM:SS
#SBATCH --time=////

# Definisi file untuk menampung output terminal program
#SBATCH --output=result-%j.txt

# Definisi file untuk menampung output error log    
#SBATCH --error=error-%j.txt 

# Nama input file R yang dijalankan
INPUT_FILE="////.R"

# Memuat modul software R
# Daftar modul lihat subbab "Modul R" di atas 
module load R////

# ----------------------------------------------------
# Script jalannya program
# ----------------------------------------------------

# Perintah menjakankan R
Rscript ${INPUT_FILE}
Template SLURM Submit Script untuk R versi MPI (RMPI)
#!/bin/bash

# -----------------------------------------------------
# Template SLURM Submit Script
# R versi MPI (RMPI) | rev.080124
# 
# NOTES: 
# 1. Isi bagian yang ditandai 4 garing (////).
# 2. Template ini bersifat referensi.
#    User dapat mengubah bagian yang perlu diubah.
# -----------------------------------------------------

# -----------------------------------------------------
# Alokasi komputasi SBATCH, input, dan module
# -----------------------------------------------------

# Alokasi jumlah core thread CPU
#SBATCH --ntasks=////

# Alokasi jumlah memori RAM (satuan GB)
#SBATCH --mem=////GB

# Alokasi limit waktu menjalankan job
# Format HH:MM:SS atau D-HH:MM:SS
#SBATCH --time=////

# Definisi file untuk menampung output terminal program
#SBATCH --output=result-%j.txt

# Definisi file untuk menampung output error log    
#SBATCH --error=error-%j.txt 

# Nama input file R yang dijalankan
INPUT_FILE="////.R"

# Memuat modul software R
# Daftar modul lihat subbab "Modul R" di atas 
module load R////

# ----------------------------------------------------
# Script jalannya program
# ----------------------------------------------------

# Memuat modul OpenMPI default
module load OpenMPI

# Perintah menjakankan R
mpirun -np ${SLURM_NTASKS} Rscript ${INPUT_FILE}
Panduan Nilai Maksimal SBATCH untuk R
Panduan Nilai Maksimal SBATCH ntasks, mem, gpus, time
Skenario Komputasi ntasks

(CPU)

mem

(RAM)

gpus

(GPU)

time

(time limit)

Fair policy usage untuk akumulasi semua job1 128 128GB 2 3-00:00:00

atau

72:00:00

R biasa 128 240GB 0
R biasa di high-mem node
  • Tambahkan #SBATCH --nodelist=epyc001
128 500GB 0
R versi MPI (RMPI)2 384 240GB2 0
Keterangan:
  1. Limitasi untuk menjaga kualitas layanan ALELEON Supercomputer.
  2. RMPI mendukung komputasi paralel MPI. Ketika jumlah ntasks lebih dari 128:
    • SLURM otomatis menjalankan job pada multi-node.
    • Parameter mem adalah alokasi memori RAM per-node.
    • Info detail buka laman MPI ALELEON Supercomputer.
Keterangan tambahan
  • Untuk akun perseorangan dengan Kredit Core Hour:
    • SLURM akan menahan job apabila:
      • ntasks * time (jam) lebih besar dari sisa CPU Core Hour user.
      • gpus * time (jam) lebih besar dari sisa GPU Hour user.
    • Cek sisa Kredit Core Hour melalui perintah:
$ sausage
3
Menjalankan Job Komputasi

Jalankan job dengan perintah sbatch.

$ sbatch <nama-SLURM-Submit-script>

Contoh menjalankan nama script my_job_submission.sh.

$ sbatch my_job_submission.sh 
4A User dapat melihat status jalannya job dengan perintah squeue berikut.
  • Apabila tidak ada output artinya tidak ada job user yang berjalan / antri pada waktu itu.
$ squeue -ul $USER

Berikut adalah daftar STATE (ST) dari squeue yang menunjukkan status berjalannya job:

Daftar STATE squeue SLURM
STATE Kepanjangan Penjelasan
R RUN Job berjalan
PD PENDING Job tertahan, lihat keterangan NODELIST(REASON)
CG COMPLETING Job selesai dan dalam proses clean-up SLURM
CA CANCELED Job dibatalkan oleh user
PR PREEMPETED Job dibatalkan oleh admin EFISON, alasan dikabarkan melalui email
S SUSPENDED Job ditahan oleh admin EFISON
4B
Menghentikan Job Komputasi

Apabila user ingin membatalkan job, gunakan perintah scancel berdasarkan job ID.

  • Job ID dapat dilihat melalui perintah squeue pada kolom JOBID.
  • User hanya bisa membatalkan job submission milik user sendiri.
$ scancel <job-ID-submission-user>

Contoh user membatalkan job submission milik user dengan ID 231.

$ scancel 231
4C Tips: Apabila program R gagal berjalan karena ada package R yang belum terinstal:
  • File output dari SBATCH error dapat merekap package R apa saja yang belum terinstal.
  • Berdasarkan info tersebut, lakukan instalasi package R.

Opsi menggunakan Web EFIRO (FIRO Job Composer)

Langkah Menjalankan R di Web EFIRO

Efirojobcomposer3.png

0
Login Web EFIRO
1
Membuka Job Composer dan Memilih Template Job
  • Buka menu Jobs > Jobs Composer pada dashboard EFIRO.
  • Pilih New Job > From Template
Menu Jobs > Jobs Composer
Menu New Jobs > From Template
2 Jcselecttemplate3.png
  • PIlih template R yang diinginkan.
  • Isi atau ganti kolom Job Name sesuai keinginan user.
  • Apabila sudah selesai, klik Create New Job.
Template R yang tersedia
Nama Template Penjelasan
R 4.3.0 "Already Tomorrow" Menjalankan R versi 4.3.0
RMPI 4.3.0 "Already Tomorrow" Menjalankan R versi 4.3.0 dengan MPI
3
Menyiapkan File Komputasi dan Library Package R

Jcjoboption3.png

Gunakan menu Edit Files untuk upload file komputasi yang dibutuhkan.

  • Laman Edit Files juga dapat melakukan download / edit / rename / delete file.
  • Fitur upload pada Edit Files mempunyai limit kapasitas 2GB per file.

Gunakan menu Open Terminal untuk melakukan instalasi library package R yang dibutuhkan.

4
Melengkapi Submit Script

Submit Script adalah "formulir" untuk menjalankan job komputasi user.

  • Lengkapi Submit Script melalui menu Open Editor.
  • Ikuti petunjuk NOTES di dalamnya.
  • Jangan lupa klik Save setiap sekali mengubah script.

Panduan Nilai Maksimal SBATCH untuk R
Panduan Nilai Maksimal SBATCH ntasks, mem, gpus, time
Skenario Komputasi ntasks

(CPU)

mem

(RAM)

gpus

(GPU)

time

(time limit)

Fair policy usage untuk akumulasi semua job1 128 128GB 2 3-00:00:00

atau

72:00:00

R biasa 128 240GB 0
R biasa di high-mem node
  • Tambahkan #SBATCH --nodelist=epyc001
128 500GB 0
R versi MPI (RMPI)2 384 240GB2 0
Keterangan:
  1. Limitasi untuk menjaga kualitas layanan ALELEON Supercomputer.
  2. RMPI mendukung komputasi paralel MPI. Ketika jumlah ntasks lebih dari 128:
    • SLURM otomatis menjalankan job pada multi-node.
    • Parameter mem adalah alokasi memori RAM per-node.
    • Info detail buka laman MPI ALELEON Supercomputer.
  • Untuk akun perseorangan dengan Kredit Core Hour:
    • SLURM akan menahan job apabila:
      • ntasks * time (jam) lebih besar dari sisa CPU Core Hour user.
      • gpus * time (jam) lebih besar dari sisa GPU Hour user.
    • Cek sisa Kredit Core Hour melalui menu Open Terminal dan jalankan perintah:
$ sausage

Jcjoboption4.png

5

Menjalankan Job Komputasi

Jalankan job dengan klik tombol Submit.

Arti kolom Status, pantau perubahan dengan refresh halaman web
Status Arti
Not Submitted Job belum pernah dijalankan.
Running Job berjalan.
Queue Job mengantri dan belum berjalan.
Langkah melihat status job ketika queue
Buka Jobs > Active Jobs pada dashboard EFIRO.
  • Lakukan langkah sesuai gambar dibawah ini
Halaman Active Jobs. Ubah opsi Your jobs untuk melihat status job user saja. Klik simbol > untuk melihat status job pending pada kolom Reason. Arti reason lihat laman Daftar Reason NODELIST ALELEON Supercomputer.
Completed Job selesai berjalan.
Failed Job berhenti di tengah jalan, bisa karena di Stop atau Delete oleh user.
Menghentikan Job Komputasi

Untuk menghentikan job yang tengah berjalan, klik tombol Stop.

Stop.png

6A
Melihat Output Komputasi

User dapat melihat output file komputasi pada kolom Folder Contents

  • Atau dengan membuka Edit Files
Kolom Folder Contents.
6B Tips: Apabila program R gagal berjalan karena ada package R yang belum terinstal:
  • File output dari SBATCH error dapat merekap package R apa saja yang belum terinstal.
  • Berdasarkan info tersebut, lakukan instalasi package R.
6C User dapat menjalankan ulang ruang job yang sama dengan mengklik kembali tombol Submit.

Notifikasi Status Jalannya Komputasi via email

SLURM ALELEON Supercomputer dapat mengirim notifikasi email kepada user dengan nama "Jojo" untuk mengabarkan status berjalannya job komputasi user. Silahkan tambahan SBATCH berikut pada Submit Script apabila user ingin menerima notifikasi email dari SLURM:

#SBATCH --mail-user=<alamat-email-user> 
#SBATCH --mail-type=BEGIN,END,FAIL

SBATCH mail-type mengatur konten email notifikasi SLURM dengan pilihan opsi yang sekiranya berguna untuk user:

  • BEGIN -> notifikasi job sudah mulai
  • END -> notifikasi job sudah selesai beserta cuplikan 20 baris terakhir dari file SBATCH output dan error.
  • FAIL -> notifikasi apabila job gagal berjalan atau berhenti tidak sewajarnya.
  • TIME_LIMIT_50 -> job telah berjalan dengan durasi waktu 50% time limit.
  • TIME_LIMIT_80 -> job telah berjalan dengan durasi waktu 80% time limit.

Menjalankan R dengan Sesi Interaktif Jupyter

Terdapat 2 langkah untuk menjalankan R melalui sesi interaktif Jupyter yaitu:

  1. Melakukan instalasi package IRKernel ketika pertama kali menggunakan Jupyter untuk R.
  2. Memulai sesi interaktif Jupyter Notebook atau Lab pada web EFIRO.

---

Instalasi Package IRkernel pertama kali

Berikut adalah langkah untuk instalasi package IRKernel (klik expand atau kembangkan):

Langkah instalasi package IRkernel R untuk masing-masing user
0 Instalasi package dilakukan melalui terminal.
  • Bagi user yang login ke web EFIRO, buka menu Clusters > Aleleon Shell Access.

Shellaccess.png

1 Aktifkan R dengan memuat modul versi R yang akan digunakan.
Versi Perintah Terminal
4.3.0 $ module load R/4.3.0-GCC11.3-MKL
2 Aktifkan modul Anaconda terbaru:
$ module load Anaconda3
2 Jalankan R dan lakukan instalasi package dengan format perintah standar:
$ R 
> install.packages('IRkernel')
> IRkernel::installspec()
> q() 
3 Buat file R profile di direktori HOME user:
$ cd
$ touch ~/.Rprofile
$ echo "options(bitmapType='cairo')" >> ~/.Rprofile

---

Memulai Sesi Jupyter

Berikut adalah langkah untuk memulai sesi Jupyter dengan kernel R:

Langkah Memulai Sesi Interaktif Jupyter

Efirojupyterlab.png

0
Login Web EFIRO
1 Buka menu Interactive Apps
  • Silahkan pilih Jupyter Notebook atau Lab sesuai referensi pribadi user.

Efirojupyternotebooklab.png

2

Mengisi Formulir Sesi Interaktif Jupyter

Isi formulir untuk memulai sesi Jupyter dengan panduan berikut:

Panduan Formulir Menggunakan Torti (Interactive Node CPU)
  • Partition -> torti
  • Number of CPU Cores -> Min: 1, maks: 32
  • Number of GPUs -> kosongkan
  • Number of hours (Durasi sesi interaktif) -> Min: 1, maks: 72
  • Anaconda Selection -> Pilih versi terbaru
  • Conda Environment Directory -> kosongkan
  • Software Modules
    • Isi dengan versi R yang akan digunakan
Versi Nama software modules
4.3.0 R/4.3.0-GCC11.3-MKL
  • Environment Setup -> kosongkan
  • Email Address
    • Sistem mengirim notifikasi ke email user ketika sesi Jupyter siap diakses.
    • Apabila butuh, isi dengan email user
Perhatikan sisa Kredit Core Hour user!
Bagi akun perseorangan, sesi Jupyter tidak akan berjalan apabila:
  • Number of CPU cores * Number of Hour lebih besar dari sisa CPU Core Hour user.
  • Number of GPUs * Number of Hour lebih besar dari sisa GPU Hour user.

Cek sisa Kredit Core Hour user dengan langkah:

  • Buka Clusters > Aleleon Shell Access pada dasboard EFIRO.
  • Jalankan perintah:
$ sausage

Shellaccess.png

4

Memulai Sesi Interaktif Jupyter

Apabila formulir sudah terisi, klik tombol Launch untuk memulai sesi Jupyter.

  • User akan diarahkan ke halaman My Interactive Sessions.
  • Tunggu hingga sesi Jupyter siap diakses.
Status sesi Jupyter mengantri menunggu alokasi hardware
5 Apabila status menunjukkan Running atau kolom berwarna hijau, klik Connect to Jupyter.
  • Sistem mulai menghitung Core Hour saat status sesi Jupyter menunjukkan running.
Sesi Jupyter siap diakses.
6 Pilih Notebook R untuk memulai sesi notebook R baik di Jupyter Notebook dan Lab.
Gunakan Notebook R untuk menjalankan kernel R di Jupyter Notebook
Gunakan Notebook R untuk menjalankan kernel R di Jupyter Lab
7A

Mengakses Kembali Sesi Interaktif Jupyter yang Berjalan

User dapat mengunjungi sesi Jupyter yang sedang berjalan di My Interactive Sessions

Interactivesession.png

7B

Menghentikan Sesi Interaktif Jupyter

User dapat menghentikan sesi Jupyter yang sedang berjalan dengan klik tombol Delete
Klik tombol Delete untuk menghentikan sesi Jupyter yang sedang berjalan

Pelaporan Kendala dan Support

Apabila menjumpai masalah teknis dalam menjalankan komputasi R, silahkan lapor dengan klik gambar berikut ini.

Wiki-pelaporankendala.jpg

---

Bila terdapat pertanyaan lainnya, silahkan hubungi admin EFISON melalui email:

support@efisonlt.com

Kontributor

EFISON mengucapkan terima kasih kepada para kontributor untuk pengujian R di ALELEON Supercomputer yang kemudian menjadi dasar penulisan tutorial di halaman ini: