SEMINAR AKADEMIK FAKULTAS TEKNIK • UNIVERSITAS NURUL JADID
Membangun Ekosistem Kolaborasi Dosen-Mahasiswa
Untuk Tri-Dharma yang Unggul
Sesi: Teknik Informatika & Teknologi Informasi | 07.00 – 12.00 WIB | 23 April 2026
Gulpi Qorik Oktagalu Pratamasunu, PhD
PEMBICARA
Tentang Saya
Pendidikan
PhD – Computer Vision
University of Tsukuba, Japan
Topik Riset
Robot Vision menggunakan Point Cloud
3D Sensing & Manipulation
Lab di Tsukuba
Computer Vision Lab (CVLab)
Prof. Kazuhiro Fukui, University of Tsukuba
Posisi Saat Ini
Dosen Teknik Informatika, UNUJA
3+
Tahun di Jepang
PhD
Computer Vision
IEEE
Published Paper
Robot
Vision Expert
Gulpi Qorik Oktagalu Pratamasunu
グルピ コリク オクタガル プラタマスヌ
■ Degree/Grade: 3rd Year Doctoral Degree
■ Hometown: Indonesia
■ Technologies and methods of interest:
■ Other:
HASIL RISET
Robot Arm & Point Cloud Vision
Thesis: Robot Vision dengan Point Cloud��
Bagaimana robot melihat dalam 3D?�
Kamera depth (Intel RealSense) menghasilkan point cloud — representasi 3D dari lingkungan sekitar robot.��
Mengapa 3D, bukan 2D?�
Kamera biasa tidak tahu seberapa jauh objek berada. Point cloud memberikan informasi jarak yang akurat — penting untuk robot agar tidak menabrak.��
Link ke VLA: Point cloud adalah input bagi model VLA untuk memutuskan bagaimana robot harus bergerak.
Kamera Depth
(Intel RealSense)
Point Cloud
(3D Data)
Vision Model
(Neural Network)
Robot Action
(Arm Movement)
KONTEKS
University of Tsukuba: Kota Sains
BUDAYA LAB
Kehidupan di Lab Riset Jepang
Weekly Research Seminar
2-3 pembicara per sesi; setiap orang mempresentasikan progress riset mereka. Mahasiswa dan dosen wajib hadir, jadwal disesuaikan dengan semua anggota.
Kemandirian Mahasiswa
Mahasiswa menjalankan proyeknya sendiri. Sensei membimbing dan mengarahkan, bukan mengerjakan. Ownership ada di mahasiswa
Fokus Publikasi Tinggi
Target utama: top-ranked conference (CVPR, ICCV, ECCV, ICRA). Bukan sekadar lulus — tapi berkontribusi pada komunitas riset global
Komunikasi via Slack
Lab menggunakan Slack untuk koordinasi, berbagi paper, dan update progress. Alternatif: Discord, Telegram, atau WhatsApp group per lab
FASILITAS LAB
Fasilitas Bersama Lab
Hardware lab digunakan bersama seluruh anggota — bukan milik pribadi, melainkan aset kolektif yang dijaga bersama
GPU
Server
Shared GPU Server
RTX cluster untuk pelatihan model deep learning. Semua anggota lab bisa menggunakannya — dengan sistem booking bersama
DGX
Spark
NVIDIA DGX Spark
AI supercomputer portabel dari NVIDIA. Digunakan untuk eksperimen skala besar: VLM, VLA, dan model robotics berat
Jetson
Nano
NVIDIA Jetson Nano
Platform edge AI untuk deployment. Model yang dilatih di GPU Server di-deploy ke sini, langsung terpasang di robot
Robot
Arm
Robot Arm
Platform fisik riset VLA dan robot vision. Tempat di mana model AI diuji di dunia nyata, bukan hanya simulasi
MANAJEMEN LAB
Lab Dikelola oleh Mahasiswa — Disetujui Sensei
Di lab Jepang, mahasiswa bukan hanya peneliti — mereka adalah pengelola fasilitas. Sensei memberi arahan dan persetujuan, mahasiswa yang menjalankan.
01
Rotasi Kebersihan
Jadwal piket dibuat dan dijalankan oleh mahasiswa. Lab harus bersih sebelum dan sesudah setiap sesi eksperimen.
02
Penataan & Kerapian Alat
Setiap alat punya tempat tetap. Anggota lab yang mengatur ulang layout wajib mendapat persetujuan sensei.
03
Sistem Booking & Komunikasi Lab
Hardware dicatat penggunaannya via shared spreadsheet. Komunikasi lab via Slack — atau Discord/Telegram/WhatsApp sebagai alternatif.
04
Safety Checklist & Laporan
Setiap eksperimen robot/hardware wajib melewati safety checklist. Progress dilaporkan ke sensei setiap minggu.
USULAN UNTUK UNUJA
Model CVLab yang bisa ditiru
Terinspirasi dari sistem lab Jepang, disesuaikan dengan konteks UNUJA — bisa langsung diterapkan
Seminar Mingguan Tingkat Fakultas
Seminar Lab per Dosen (Mingguan)
Peran Mahasiswa di Seminar Lab
Mahasiswa TA (Semester 7–8)
Presentasi progress skripsi: metode, eksperimen, hasil terbaru, dan hambatan. Mendapat feedback langsung dari dosen dan senior.
Mahasiswa Semester 5 - 6
Presentasi eksplorasi topik: paper yang dibaca, topik yang diminati, dan rencana penelitian awal. Dibantu memilih arah riset.
STANDAR RISET
Dari Skripsi ke Jurnal Internasional
Tugas Akhir Umum
Riset Level Internasional
TOOLS RISET
Ekosistem Tools Internasional
Menulis & Publikasi
Kode & Version Control
Compute & Deployment
Manajemen Lab
BAGIAN 2
The AI Stack: Dari Bahasa ke Aksi
OVERVIEW
Evolusi AI: LLM → VLM → VLA
AI yang dulu hanya bisa berbicara, kini bisa melihat — dan bertindak di dunia nyata
LLM
Large Language Model
Memahami & menghasilkan teks. Fondasi semua AI modern.
VLM
Vision Language Model
Melihat gambar + memahami konteks. Contoh: Gemma 4 (2025).
VLA
Vision Language Action
Melihat, memahami, dan menggerakkan robot secara fisik.
Thesis saya memberikan robot 3D vision (Point Cloud) — input kritis untuk VLA | Gemma 4: contoh VLM open-source terbaru
LAYER 1
LLM: Fondasi Bahasa
Apa itu LLM?�
Model yang dilatih pada miliaran teks untuk memahami dan menghasilkan bahasa alami. Fondasi dari semua AI percakapan modern.��
Contoh yang kamu kenal:�
ChatGPT, Claude, Gemma, LLaMA, GPT-4��
Kemampuan utama:�
Menjawab pertanyaan, merangkum dokumen, menulis kode, menalar masalah kompleks
LLM
ChatGPT
Claude
Gemma 4
LLaMA
GPT-4
LAYER 2
VLM: Sekarang AI Bisa Melihat
Apa itu VLM?�
Vision Language Model menggabungkan kemampuan memahami gambar dan teks secara bersamaan — AI tidak lagi buta.��
Contoh terbaru — Gemma 4:�
Model open-source dari Google (2025) yang ringan, bisa melihat gambar, dan menjawab pertanyaan tentangnya.��
Aplikasi nyata:�
Deteksi objek + narasi bahasa, robot yang bisa membaca instruksi visual, asisten kamera
VLM
Image
+
Text
=
Understanding
Gemma 4 — Google 2025
Open-source, bisa dicoba
sekarang, gratis
LAYER 3
VLA: Sekarang AI Bisa Bertindak
Apa itu VLA?�
Vision Language Action model melihat lingkungan, memahami instruksi, lalu menggerakkan robot secara fisik. Ini frontier riset saat ini.��
Model-model terkemuka:�
OpenVLA (Berkeley), RT-2 (Google DeepMind), Pi0 — berlomba membangun VLA yang andal di dunia nyata.��
Hubungan dengan thesis saya:�
Point cloud dari kamera depth adalah input 3D kritis bagi VLA — tanpa visi 3D yang akurat, robot tidak bisa memutuskan gerak yang tepat.
VLA
1. Melihat (Camera + LiDAR)
2. Memahami (VLM)
3. Merencanakan (LLM)
4. Bertindak (Robot Arm)
UNTUK MAHASISWA
Topik Riset yang Bisa Kamu Mulai Hari Ini
VLM untuk Bahasa Indonesia
Fine-tune Gemma 4 agar mengerti instruksi Bahasa Indonesia dalam konteks visual
Edge AI di Jetson Nano
Optimasi model deep learning agar berjalan efisien di hardware edge terbatas
Robot Arm + OpenVLA
Implementasi VLA open-source pada robot arm — dari simulasi ke hardware nyata
Point Cloud untuk Lokal
3D vision untuk monitoring pertanian, inspeksi bangunan, atau navigasi indoor
Synthetic Data dengan Unity
Pipeline data sintetis RGB + Depth untuk melatih model vision tanpa ribuan data nyata
LLM Asisten Riset
RAG system agar mahasiswa bisa tanya-jawab paper ilmiah dalam Bahasa Indonesia
SEMINAR AKADEMIK • FAKULTAS TEKNIK • UNIVERSITAS NURUL JADID
Bangun Labnya.
Kelola Bersama.
Riset dari Situ.
Publikasikan ke Dunia.
Tridharma bukan sekadar kewajiban — ini cara kita berkontribusi nyata untuk ilmu pengetahuan,
mahasiswa kita, dan masyarakat Indonesia.
Terima kasih | ありがとうございます