1 of 31

Implementasi Shallow Neural Network untuk Mendeteksi Kebohongan Berita Politik pada Web App “Bold.”

Cybernetic Protector

TURNAMEN SAINS DATA NASIONAL 2023

2 of 31

TURNAMEN SAINS DATA NASIONAL 2023

3 of 31

TURNAMEN SAINS DATA NASIONAL 2023

4 of 31

TURNAMEN SAINS DATA NASIONAL 2023

5 of 31

Daftar Isi

TURNAMEN SAINS DATA NASIONAL 2023

Informasi Tim

Pendahuluan dan Latar Belakang

Analisis Kebutuhan Data

Alur Kerja

Screen Capture Web App

Kesimpulan

01

02

03

04

05

06

6 of 31

TURNAMEN SAINS DATA NASIONAL 2023

7 of 31

Pendahuluan dan Latar Belakang

TURNAMEN SAINS DATA NASIONAL 2023

8 of 31

Jumlah warganet meningkat, penyebaran berita hoax bertambah

TURNAMEN SAINS DATA NASIONAL 2023

77,02%

*Tahun 2021-2022 (Q1)

penduduk Indonesia merupakan pengguna internet.

*Asosiasi Penyelenggara Jasa

Internet Indonesia

11.2%

11.9%

Terjadi peningkatan penyebaran hoax yang dilakukan responden berdasarkan survey Katadata Insight Center (KIC).

**Tahun 2020-2021

**Survey dilakukan pada tanggal 4 hingga 24 Oktober 2021 di 34 provinsi dan 514 kabupaten/kota di Indonesia

9 of 31

Berapa banyak berita hoax yang tersebar di Indonesia?

TURNAMEN SAINS DATA NASIONAL 2023

Kesehatan menjadi kategori paling top dalam berita hoax yang disebarkan, sedangkan Pendidikan menjadi kategori dengan penyebaran berita hoax paling rendah.

Siaran Pers No. 50/HM/KOMINFO/04/2023

10 of 31

Bagaimana dengan penyebaran hoax di bidang politik?

Pada periode tersebut, tahun 2019 ditemukan berita hoax tertinggi yaitu sebanyak 928 yang merupakan tahun pemilu. Tahun 2022 jumlah berita hoax kembali meningkat, dan menjelang pemilu 2024, berita hoax akan semakin banyak bermunculan.

TURNAMEN SAINS DATA NASIONAL 2023

Statistik Temuan Hoaks Politik Periode 2016 s.d 20 Desember 2022

11 of 31

Apa Dampaknya?

  • Mengancam kualitas pesta demokrasi
  • Merusak akal sehat calon pemilih
  • Mendelegitimasi proses penyelenggaraan pemilu
  • Merusak kerukunan masyarakat yang mengarah ke disintegrasi bangsa

TURNAMEN SAINS DATA NASIONAL 2023

Ujar Septiaji Eko Nugroho, Ketua Masyarakat Anti Fitnah Indonesia (Mafindo) dalam berita KOMINFO berjudul “Hoaks Makin Merajalela Jelang Pemilu”

12 of 31

Solusi yang ditawarkan

Bertujuan untuk

  • Mencegah dan mengatasi penyebaran hoaks
  • Mengedukasi
  • Meningkatkan kesadaran masyarakat akan bahaya hoax

Aplikasi akan menerima input teks berita dan kemudian akan memprediksi apakah teks tersebut merupakan fakta atau hoax.

TURNAMEN SAINS DATA NASIONAL 2023

BOLD.

Web App Pendeteksi Berita Politik Hoax

13 of 31

Keunikan web app

Tersedia fitur untuk:

  • Selain input teks berita, user juga dapat input link berita untuk prediksi
  • Melaporkan berita hoax
  • Memberikan feedback saat model salah prediksi
  • Memberikan informasi tentang cara menangani berita hoax

TURNAMEN SAINS DATA NASIONAL 2023

BOLD.

Web App Pendeteksi Berita Politik Hoax

14 of 31

Analisis Kebutuhan Data

TURNAMEN SAINS DATA NASIONAL 2023

15 of 31

Data berasal dari Kaggle, yang merupakan hasil scraping teks berita dari CNN, Kompas, Tempo, dan Turnbackhoax.

TURNAMEN SAINS DATA NASIONAL 2023

Teks berita hoax diberi label 1, sedangkan teks berita valid diberi label 0.

16 of 31

TURNAMEN SAINS DATA NASIONAL 2023

Struktur folder dataset

Distribusi panjang teks di setiap label

Proporsi label pada dataset

17 of 31

Alur Kerja

TURNAMEN SAINS DATA NASIONAL 2023

18 of 31

Workflow

TURNAMEN SAINS DATA NASIONAL 2023

19 of 31

Tools yang digunakan

TURNAMEN SAINS DATA NASIONAL 2023

20 of 31

Proses Pembuatan Model (Tahapan 1-2)

TURNAMEN SAINS DATA NASIONAL 2023

  • Remove HTML
  • Remove non-ASCII character
  • Remove symbols, emojis, and other graphic characters
  • Lowercase text
  • Text visualization
  • Data Cleaning
  • Handling imbalance data with undersampling

Data Understanding

Text Preprocessing

21 of 31

Proses Pembuatan Model (Tahapan 3-5)

TURNAMEN SAINS DATA NASIONAL 2023

  • Split data into 3 sets
  • Tokenization
  • Sequence and Padding
  • Define model architecture
  • Training

Export model and tokenizer

  • Observe model performance using Accuracy in all sets, also Confusion Matrix in test set
  • Live prediction with test set
  • Export model to h5 file
  • Export tokenizer to pickle file

Modeling

Evaluation

22 of 31

Capaian Model pada Train dan Validation Set

TURNAMEN SAINS DATA NASIONAL 2023

Menggunakan 30 epochs diperoleh skor akurasi sebesar 0.9369 ~ 0.9360 pada training dan validation set.

23 of 31

Capaian Model pada Test Set

TURNAMEN SAINS DATA NASIONAL 2023

False Positive yang dimiliki model masih tergolong besar, meskipun akurasi yang dihasilkan di atas 90%.

24 of 31

Tahapan Membuat Web App

TURNAMEN SAINS DATA NASIONAL 2023

  • Design UI/UX in Figma
  • Utilize HTML, CSS, ReactJS for slicing design

Frontend

Backend Configuration

Web deploy & Hosting

  • Serve prediction model in endpoint FLASK API
  • Host web app using Firebase hosting

25 of 31

Screen Capture Web App

TURNAMEN SAINS DATA NASIONAL 2023

26 of 31

TURNAMEN SAINS DATA NASIONAL 2023

27 of 31

TURNAMEN SAINS DATA NASIONAL 2023

Link menuju web app: https://tsdn23-bold.web.app/

28 of 31

Kesimpulan

TURNAMEN SAINS DATA NASIONAL 2023

Shallow Neural Network mampu memberikan akurasi yang tinggi di training, validation, dan test set dengan rincian: 0.9369, 0.9360, 0.94.

Melalui integrasi dengan hugging face, docker, dan firebase, endpoint model prediksi serta 4 fitur unik dapat berjalan dengan lancar di website.

29 of 31

Daftar Pustaka

A. Arbain, Meizano A. Muhammad, Trisya Septiana, Hery D. Septama, Raden Arum S.P. 2022. Komparasi Implementasi Model Machine Learning Hoax News Pada Local Dan Cloud Computing Deployment Menggunakan Google App Engine. JITET (Jurnal Informatika dan Teknik Elektro Terapan), Vol. 10 No. 3.

Arrafi, N. (2022, August 23). Saatnya Indonesia Merdeka dari Berita Hoax. Retrieved November 14, 2023, from https://digitalbisa.id/artikel/saatnya-indonesia-merdeka-dari-berita-hoax-qSlmu

Bagas P. Nayogaa, Ryan Adipradanaa, Ryan Suryadia, Derwin Suhartonoa. 2020. Hoax Analyzer for Indonesian News Using Deep Learning Models. Procedia Computer Science, 179, pp. 704–712.

CNN Indonesia. (2022, December 22). Hoaks Politik Mulai Naik Meski Belum Setinggi 2019, Simak Daftarnya. Retrieved November 14, 2023, from

https://www.google.com/amp/s/www.cnnindonesia.com/nasional/20221222180513-617-890935/hoaks-politik-mulai-naik-meski-belum-setinggi-2019-simak-daftarnya/amp

TURNAMEN SAINS DATA NASIONAL 2023

30 of 31

Daftar Pustaka

KOMINFO. (2019, Maret 19). Hoaks Makin Merajalela Jelang Pemilu. Retrieved November 14, 2023, from

https://www.kominfo.go.id/content/detail/17270/hoaks-makin-merajalela-jelang-pemilu/0/sorotan_media

KOMINFO. (2023, April 6). Triwulan Pertama 2023, Kominfo Identifikasi 425 Isu Hoaks. Retrieved November 14, 2023, from

https://www.kominfo.go.id/content/detail/48363/siaran-pers-no-50hmkominfo042023-tentang-triwulan-pertama-2023-kominfo-identifikasi-425-isu-hoaks/0/siaran_pers

Rizqullah, Razif Muhammad., Ghaida, Radhinansyah Hemsa., Hadi, Steve Immanuel. (2023). Indonesian Fake and Hoax Political News. https://www.kaggle.com/datasets/linkgish/indonesian-fact-and-hoax-political-news

Sinapoy, M. I. K Sibaroni, Y. Prasetyowati, Sri S. Prasetyowati. 2023. Comparison of LSTM and IndoBERT Method in Identifying Hoax on Twitter. Jurnal RESTI (Rekayasa Sistem dan Teknologi Informasi), Vol. 7 No. 3.

TURNAMEN SAINS DATA NASIONAL 2023

31 of 31

TERIMA KASIH

SEKIAN

TURNAMEN SAINS DATA NASIONAL 2023