Model Deteksi Berita Hoaks Bahasa Indonesia Menggunakan Multinomial Naïve Bayes dan AdaBoost Classifier

Haniifaa Hafiizh; Safitri Juanita

doi:10.47065/bulletincsr.v6i2.927

Authors

Haniifaa Hafiizh Universitas Budi Luhur, Jakarta, Indonesia
Safitri Juanita Universitas Budi Luhur, Jakarta, Indonesia

DOI:

https://doi.org/10.47065/bulletincsr.v6i2.927

Keywords:

AdaBoost; Hoax News; CRISP-DM; Text Classification; TF-IDF

Abstract

The rapid growth of the internet has led to the massive and uncontrolled dissemination of information across various digital platforms, allowing hoax news to reach a wide audience and influence public opinion in a short period of time. This condition highlights the need for a reliable automated detection system. However, existing methods still face limitations in terms of accuracy, result stability, and reliance on manual verification processes. Therefore, this study aims to compare and analyze the performance of two classification algorithms in detecting Indonesian-language hoax news accurately and effectively. This study follows the CRISP-DM framework, beginning with the collection of hoax and non-hoax news articles from turnbackhoax.id and detik.com, resulting in 2,281 samples. The data understanding stage involves analyzing dataset characteristics and evaluating data quality. During data preparation, text elements that explicitly indicate hoax labels are removed, followed by feature extraction using Term Frequency–Inverse Document Frequency (TF-IDF). The dataset is then trained and tested using data split ratios of 70:30, 80:20, and 90:10 by applying Multinomial Naïve Bayes and AdaBoost Classifier algorithms. Model performance is evaluated using a confusion matrix. The results show that AdaBoost achieves superior performance, with an accuracy of 0.9879 (98.79%), outperforming Multinomial Naïve Bayes, which attains an accuracy of 0.9712 (97.12%). The performance of AdaBoost is also consistent across different evaluation scenarios, indicating that it is more suitable as an automated hoax news detection model for the dataset used in this study.

Downloads

Download data is not yet available.

References

E. R. Herman Purba, “Realitas dan Viralitas: Dinamika dan Isu dalam Era Media Baru di Indonesia,” Kinesik, vol. 11, no. 03, pp. 283–299, 2024, doi: 10.22487/ejk.v11i3.1213.

M. A. Maulana and S. Aristi, “Analisis Penentuan Dolus dan Culpa dalam Penyebaran Hoax Melalui Digital,” J. Multidisiplin West Sci., vol. 3, no. 10, pp. 1581–1591, 2024, doi: 10.58812/jmws.v3i10.1612.

H. A. Taufik Fajar Mustafa, “Klasifikasi Berita Palsu Berbahasa Indonesia Menggunakan Algoritma Naive Bayes Berbasis Web,” J. Sains Inform. Terap. ( JSIT ), vol. 4, no. 3, pp. 657–663, 2025, doi: 10.62357/jsit.v4i3.564.

M. R. F. M. Melda Agarina, Sutedi, Arman Suryadi Karim, “Menangkal Hoax dengan Literasi Digital bagi Masyarakat Desa Jati Indah,” J. Pengabdi. Kpd. Masy., vol. 2, no. 2, pp. 134–137, 2023, doi: 10.32877/nr.v2i2.744.

Y. D. Butar, “Analisis Penyebaran Hoax Di Media Sosial Dan Dampaknya Terhadap Masyarakat,” JPBB, vol. 3, no. 2, pp. 252–258, 2024, doi: 10.55606/jpbb.v3i2.3201.

E. W. P. Ikhlasul Amal, “Aplikasi Pendeteksi Berita Palsu Bahasa Indonesia Menggunakan Framework Flask Dan Streamlit Serta Algoritma Machine Learning,” Univ. Muhammadiyah Surakarta, pp. 1–18, 2023, [Online]. Available: http://eprints.ums.ac.id/id/eprint/116531

P. Y. R. Athifahputih, “Penegakan Hukum Terhadap Penyebaran Berita Hoax Di Lihat Dari Tinjauan Hukum,” J. Huk. dan Pembang. Ekon., vol. 10, no. 1, pp. 64–76, 2022, doi: 10.20961/hpe.v10i1.62843.

M. N. Raza, “Sistem Deteksi Berita Hoax Menggunakan Algoritma Naive Bayes Dan Random Forest Pada Machine Learning,” Pondasi J. Appl. Sci. Eng., vol. 1, no. 2, pp. 43–57, 2024, [Online]. Available: https://journal.alshobar.or.id/index.php/pondasi/article/view/221

J. Pareza Alam Jusia, Riza Pahlevi, Daniel Sintong Pardamean Simanjuntak, “Peningkatan Performa Naive Bayes dengan Fitur Chi-Square pada Analisis Sentimen Komentar Pengguna Aplikasi Netflix,” Bull. Comput. Sci. Res., vol. 5, no. 4, pp. 614–621, 2025, doi: 10.47065/bulletincsr.v5i4.532.

U. F. Ayuni Asistyasari, Bibit Sudarsono, “Klasifikasi Berita Hoaks Menggunakan Algoritma Vector Space Model,” INFOTECHJurnal Inform. Teknol., vol. 2, no. 2, pp. 112–119, 2021, doi: 10.37373/infotech.v2i2.176.

F. Arsyad, N. Hayatin, C. Sri, and K. Aditya, “Deteksi Konten Hoax Pada Media Berita Indonesia Menggunakan Multinomial Naïve Bayes,” Repositor, vol. 5, no. 4, pp. 921–930, 2023, doi: 10.22219/repositor.v5i4.32092.

N. S. Isnin Apriyatin Ropikoh, Rijal Abdulhakim, Ultach Enri, “Penerapan Algoritma Support Vector Machine (SVM) untuk Klasifikasi Berita Hoax Covid-19,” J. Appl. Informatics Comput., vol. 5, no. 1, pp. 64–73, 2021, doi: 10.30871/jaic.v5i1.3167.

W. A. Yusuf Kurnia, Ellysha Dwiyanthi Kusuma, Lianny Wydiastuty Kusuma, Suwitno, “Perbandingan Naïve Bayes dan CNN yang Dioptimasi PSO pada Identifikasi Berita Hoax Politik Indonesia,” Bit-Tech (Binary Digit. -Technology), vol. 6, no. 3, pp. 340–352, 2024, doi: 10.32877/bt.v6i3.1225.

N. H. Chita Nauly Harahap, Gita Indah Marthasari, “Perbandingan Klasifikasi Berita Hoax Kategori Kesehatan Menggunakan Naive Bayes dan Mltinomial Naive Bayes,” REPOSITOR, vol. 3, no. 4, pp. 419–424, 2021, doi: 10.22219/repositor.v3i4.31964.

E. U. Alfin Mahadi, “Analisa Perbandingan Algorithma K-Nearest Neighbors dan Random Forest untuk Klasifikasi Tindakan Medis Persalinan pada Data Kehamilan Multi-Variabel,” Bull. Comput. Sci. Res., vol. 5, no. 4, pp. 424–433, 2025, doi: 10.47065/bulletincsr.v5i4.556.

B. S. A. Ike Verawati, “Algoritma Naïve Bayes Classifier Untuk Analisis Sentiment Pengguna Twitter Terhadap Provider By.u,” J. Media Inform. Budidarma, vol. 6, no. 3, pp. 1411–1417, 2022, doi: 10.30865/mib.v6i3.4132.

A. H. M. Wahyu Aji Tri Riswandhana, “Optimalisasi Akurasi Algoritma C4.5 dengan Metode Adaptive Boosting Memprediksi Siswa dalam Menerima Dana Pendidikan,” G-Tech J. Teknol. Terap., vol. 8, no. 4, pp. 2895–2902, 2024, doi: 10.70609/gtech.v8i4.5612.

Y. A. Singgalen, “Penerapan Metode CRISP-DM dalam Klasifikasi Data Ulasan Pengunjung Destinasi Danau Toba Menggunakan Algoritma Naïve Bayes Classifier ( NBC ) dan Decision Tree ( DT ),” J. Media Inform. Budidarma, vol. 7, no. 3, pp. 1551–1562, 2023, doi: 10.30865/mib.v7i3.6461.

I. Ade Maysa, Syarifah Putri Agustini Alkadri, “Klasifikasi Tingkat Kepuasan Di Maskapai Penerbangan: Studi Komparasi Algoritma K-NN Dan AdaBoost,” JIP (Jurnal Inform. Polinema), vol. 10, no. 3, pp. 405–412, 2023, doi: 10.33795/jip.v10i3.5166.

I. M. T. Dian Tri Wilujeng, Mohamat Fatekurohman, “Analisis Risiko Kredit Perbankan Menggunakan Algoritma K-Nearest Neighbor dan Nearest Weighted K-Nearest Neighbor,” Indones. J. Appl. Stat., vol. 5, no. 2, pp. 142–148, 2023, doi: 10.13057/ijas.v5i2.58426.

Y. A. Mujaddid Izzul Fikri, Trifebi Shina Sabrila, “Perbandingan Metode Naïve Bayes dan Support Vector Machine pada Analisis Sentimen Twitter,” SMATIKA J., vol. 10, no. 02, pp. 71–76, 2020, doi: 10.32664/smatika.v10i02.455.

N. Y. Rilinka, Indriati, “Analisis Sentimen Penghapusan Ujian Nasional pada Twitter menggunakan Document Frequency Difference dan Multinomial Naïve Bayes,” J. Pengemb. Teknol. Inf. dan Ilmu Komput., vol. 5, no. 3, pp. 876–883, 2021, [Online]. Available: https://j-ptiik.ub.ac.id/index.php/j-ptiik/article/view/8659

Bila bermanfaat silahkan share artikel ini

Berikan Komentar Anda terhadap artikel Model Deteksi Berita Hoaks Bahasa Indonesia Menggunakan Multinomial Naïve Bayes dan AdaBoost Classifier

Model Deteksi Berita Hoaks Bahasa Indonesia Menggunakan Multinomial Naïve Bayes dan AdaBoost Classifier

Authors

DOI:

Keywords:

Abstract

Downloads

References

ARTICLE HISTORY

How to Cite

Issue

Section

Most read articles by the same author(s)