Analisis Sentimen Program Makan Bergizi Gratis Menggunakan Random Forest dan Support Vector Machine dengan Penyeimbangan Data Berbasis SMOTE

Authors

  • Slamet Endro Prianto Magister Ilmu Komputer, Fakultas Ilmu Komputer, Universitas Amikom Purwokerto, Indonesia
  • Berlilana Berlilana Fakultas Ilmu Komputer, Universitas Amikom Purwoekrto, Indonesia
  • Rujianto Eko Saputro Fakultas Ilmu Komputer, Universitas Amikom Purwoekrto, Indonesia

DOI:

https://doi.org/10.52436/1.jpti.1491

Keywords:

Analisis Kebijakan Publik, Analisis Sentimen, Program MBG, Random Forest, Support Vector Machine

Abstract

Sentimen publik yang diekspresikan melalui media sosial telah menjadi sumber data penting untuk mengevaluasi kebijakan publik, termasuk Program Makan Bergizi Gratis (MBG). Namun, analisis sentimen pada data teks terkait kebijakan menghadapi tantangan utama karena fitur tekstual berdimensi tinggi, kompleksitas linguistik, serta distribusi kelas yang tidak seimbang. Permasalahan ini dapat menyebabkan kinerja model menjadi bias dan menghasilkan interpretasi kebijakan yang kurang akurat apabila tidak ditangani dengan tepat. Penelitian ini bertujuan untuk mengevaluasi kinerja Random Forest (RF) dan Support Vector Machine (SVM) dalam mengklasifikasikan sentimen publik terhadap MBG serta menilai efektivitas SMOTE dalam menangani ketidakseimbangan kelas. Penelitian ini menggunakan pendekatan kuantitatif dengan 2.349 tweet yang dikumpulkan dari platform X (Twitter). Data dipraproses melalui tahapan pembersihan teks (text cleaning), case folding, tokenisasi, normalisasi, penghapusan stopword, dan stemming. Ekstraksi fitur dilakukan menggunakan TF-IDF. Klasifikasi sentimen dilakukan menggunakan model RF dan SVM pada kondisi data tidak seimbang dan data yang telah diseimbangkan. Kinerja model dievaluasi menggunakan metrik akurasi, presisi, recall, dan macro-average F1-score. Hasil penelitian menunjukkan bahwa baik RF maupun SVM menghasilkan kinerja klasifikasi yang relatif rendah, dengan nilai akurasi dan macro-average F1-score berkisar antara 0,32 hingga 0,34. Penerapan SMOTE mampu memperbaiki distribusi kelas dan mengurangi bias prediksi, namun peningkatan kinerja secara keseluruhan masih bersifat marginal. Untuk data teks, SMOTE tidak selalu meningkatkan representasi makna secara signifikan, karena proses oversampling menghasilkan data sintetis yang didasarkan pada ruang fitur numerik tanpa mempertimbangkan konteks semantik kalimat. SVM menunjukkan kinerja yang lebih stabil dibandingkan RF, terutama dalam menangani fitur teks yang berdimensi tinggi dan bersifat sparse. Temuan ini menunjukkan bahwa penyeimbangan data saja belum cukup untuk secara signifikan meningkatkan kinerja klasifikasi sentimen. Karakteristik data teks yang kompleks, seperti variasi bahasa informal, singkatan, dan ekspresi pendapat yang ambigu dalam media sosial, juga menyebabkan keterbatasan peningkatan kinerja. Penelitian ini menekankan pentingnya mengombinasikan teknik penyeimbangan data dengan model semantik kontekstual guna meningkatkan kualitas analisis sentimen dalam evaluasi kebijakan publik. Metode berbasis fitur seperti TF-IDF dapat memberikan representasi makna yang lebih kaya, sehingga dapat meningkatkan kapasitas model untuk memahami konteks opini publik terhadap kebijakan.

Downloads

Download data is not yet available.

References

P. T. Ogan, O. I. District, and A. H. Fahlevi, “Implementation of Good Corporate Governance (GCG) Principles in PDAM Tirta Ogan, Ogan Ilir District,” in IAPA International Conference 2024 Towards World Class Bureaucracy, 2024, pp. 187–405. doi: 10.23920/jphp.v1i2.292.1.

R. Hidayat and D. J. Ratnaningsih, “Analisis Sentimen Program Makanan Bergizi Gratis Menggunakan Algoritma Random Forest dan Naive Bayes,” J. Comput. Informatics Res., vol. 5, no. 1, pp. 395–400, 2025, doi: 10.47065/comforch.v5i1.2355.

P. Arsi and R. Waluyo, “Analisis Sentimen Wacana Pemindahan Ibu Kota Indonesia Menggunakan Algoritma Support Vector Machine (SVM),” J. Teknol. Inf. dan Ilmu Komput., vol. 8, no. 1, p. 147, 2021, doi: 10.25126/jtiik.0813944.

M. Azhari and P. Parjito, “Analisis Sentimen Opini Publik Program Makan Siang Gratis dengan Random Forest Pada Media,” Build. Informatics, Technol. Sci., vol. 6, no. 3, pp. 1932–1942, 2024, doi: 10.47065/bits.v6i3.6423.

A. R. Isnain, N. S. Marga, and D. Alita, “Sentiment Analysis Of Government Policy On Corona Case Using Naive Bayes Algorithm,” IJCCS (Indonesian J. Comput. Cybern. Syst., vol. 15, no. 1, p. 55, 2021, doi: 10.22146/ijccs.60718.

Fatkhurrohman, B. I. Nugroho, and N. Fadillah, “Analisis Sentimen Program Makan Bergizi Gratis Pemerintah RI Melalui Twitter Menggunakan Metode SVM,” J. Artif. Intell. Digit. Bus., vol. 4, no. 3, pp. 3906–3917, 2025, doi: 10.31004/riggs.v4i3.2533.

P. Zakiyah, K. Umam, and A. A. Mahfudh, “Public Opinion on The MBG Program?: Comparative Evaluation of InSet and VADER Lexicon Labeling Using SVM on Platform X,” vol. 9, no. 6, pp. 3937–3944, 2025, doi: https://doi.org/10.30871/jaic.v9i6.9978.

A. Ma’ruf, A. E. Pajri, and P. Liana, “Sentiment Analysis of President Prabowo’s Performance on Twitter (X) with a Comparative Study of SVM, XGBoost, and AdaBoost,” J. Appl. Informatics Comput., vol. 10, no. 1, pp. 684–697, 2026, doi: https://doi.org/10.30871/jaic.v10i1.12138.

A. Sitanggang, Y. Umaidah, Y. Umaidah, R. I. Adam, and R. I. Adam, “Analisis Sentimen Masyarakat Terhadap Program Makan Siang Gratis Pada Media Sosial X Menggunakan Algoritma Naïve Bayes,” J. Inform. dan Tek. Elektro Terap., vol. 12, no. 3, 2024, doi: 10.23960/jitet.v12i3.4902.

S. Shafwah and H. Al Azies, “Komparasi SVM dan IndoBERT dalam Klasifikasi Sentimen Program Makanan Bergizi Gratis,” vol. 10, no. 2, pp. 105–112, 2025, doi: 10.31544/jtera.v10.i2.2025.105-112.

S. C. Amaria and N. Hidayati, “Analisis Program Makan Bergizi Gratis Dengan Support Vector Machine (SVM) Pada Aplikasi X,” J. Sist. Inf., vol. 12, no. 2, pp. 16–24, 2025, doi: https://doi.org/10.30656/jsii.v12i2.10708.

R. Saputra and F. N. Hasan, “Analisis Sentimen Terhadap Program Makan Siang & Susu Gratis Menggunakan Algoritma Naive Bayes,” J. Teknol. Dan Sist. Inf. Bisnis, vol. 6, no. 3, pp. 411–419, Jul. 2024, doi: 10.47233/jteksis.v6i3.1378.

M. M. Rahman, N. I. Khan, I. H. Sarker, M. Ahmed, and M. N. Islam, “Leveraging Machine Learning to Analyze Sentiment from COVID-19 Tweets: A Global Perspective,” Eng. Reports, vol. 5, no. 3, pp. 1–23, 2023, doi: 10.1002/eng2.12572.

Y. Muhamad, I. Mahendra, and A. Faqih, “SMOTE untuk Meningkatkan Performa Naïve Bayes dan Random Forest dalam Analis Sentimen aplikasi Digitalent,” J. Din. Inform. Vol., vol. 14, no. 2, pp. 13–25, 2025, doi: https://doi.org/10.31316/jdi.v14i2.347.

V. Agresia and R. R. Suryono, “Comparison of SVM, Naïve Bayes, and Logistic Regression Algorithms for Sentiment Analysis of Fraud and Bots in Purchasing Concert Ticket,” J. Inovtek Polbeng, vol. 10, no. 2, pp. 591–602, 2025, doi: https://doi.org/10.35314/npyfdh47.

A. N. Syafia, M. F. Hidayattullah, and W. Suteddy, “Studi Komparasi Algoritma SVM Dan Random Forest Pada Analisis Sentimen Komentar Youtube BTS,” J. Pengemb. IT, vol. 8, no. 3, pp. 207–212, 2023, doi: https://doi.org/10.30591/jpit.v8i3.5064.

H. Ali, N. Hendrastuty, C. Science, and U. T. Indonesia, “Comparison of Naïve Bayes Classifier, Support Vector Machine, Random Forest Algorithms for Public Sentiment Analysis of Kip-K Program on Twitter,” J. Tek. Inform., vol. 5, no. 6, pp. 1701–1712, 2024, doi: https://doi.org/10.52436/1.jutif.2024.5.6.4030.

G. Gverdtsiteli, “Authoritarian Environmentalism in Vietnam: the Construction of Climate Change as a Security Threat,” Environ. Sci. Policy, vol. 140, no. December 2022, pp. 163–170, 2023, doi: 10.1016/j.envsci.2022.12.004.

A. Hizqil and Y. Ruldeviani, “Sentiment analysis of online licensing service quality in the energy and mineral resources sector of the Republic of Indonesia,” Comput. Sci. Inf. Technol., vol. 5, no. 1, pp. 63–71, 2024, doi: 10.11591/csit.v5i1.pp63-71.

Asro, Sudaryono, and A. Sulaiman, “Analisis Sentimen tentang Transformasi Program Makan Siang menjadi Makan Bergizi Gratis menggunakan Logistik Regression pada laman Youtube,” J. ICT Inf. Commun. Technol., vol. 24, no. 1, pp. 87–94, 2024, [Online]. Available: https://ejournal.ikmi.ac.id/index.php/jict-ikmi

N. R. Febriyanti, K. Kusrini, and A. D. Hartanto, “Analisis Perbandingan Algoritma SVM, Random Forest dan Logistic Regression untuk Prediksi Stunting Balita,” Edumatic J. Pendidik. Inform., vol. 9, no. 1, pp. 149–158, 2025, doi: 10.29408/edumatic.v9i1.29407.

I. N. Amalina and W. M. Ashari, “Analysis of the Performance Comparison Between Random Forest and SVM RBF in Detecting Cyberbullying on Imbalanced Data With the SMOTE Approach,” Sist. J. Sist. Inf., vol. 14, no. 6, pp. 2768–2778, 2025, doi: https://doi.org/10.32520/stmsi.v14i6.5574.

D. T. Attaulah and D. Soyusiawaty, “Analisis Sentimen Program Makan Siang Gratis di Twitter/X menggunakan Metode BI-LSTM,” Edumatic J. Pendidik. Inform., vol. 9, no. 1, pp. 294–303, Apr. 2025, doi: 10.29408/edumatic.v9i1.29725.

P. P. Putra, M. K. Anam, A. S. Chan, A. Hadi, and N. Hendri, “Optimizing Sentiment Analysis on Imbalanced Hotel Review Data Using SMOTE and Ensemble Machine Learning Techniques,” vol. 6, no. 2, pp. 936–951, 2025, doi: https://doi.org/10.47738/jads.v6i2.618.

I. Hermansyah and M. S. Hasibuan, “Sentiment Analysis of Free Nutritious Meal Programme on Social Media X using Linear Regression and Random Forest Algorithms,” PIKSEL Penelit. Ilmu Komput. Sist. Embed. Log., vol. 13, no. 1, pp. 55–68, 2025, doi: 10.33558/piksel.v13i1.10633.

M. G. Hussain, B. Sultana, M. Rahman, and M. R. Hasan, “Comparison analysis of Bangla news articles classification using support vector machine and logistic regression,” Telkomnika (Telecommunication Comput. Electron. Control., vol. 21, no. 3, pp. 584–591, 2023, doi: 10.12928/TELKOMNIKA.v21i3.23416.

A. A. Rohman, A. G. Trisnapradika, and K. Kunci, “Perbandingan Algoritma NBC, SVM, Logistic Regression untuk Analisis Sentimen Terhadap Wacana KaburAjaDulu di Media Sosial X,” Technol. Sci., vol. 7, no. 1, pp. 169–178, 2025, doi: 10.47065/bits.v7i1.7261.

H. Henderi and Q. Siddique, “Comparative Analysis of Sentiment Classification Techniques on Flipkart Product Reviews: A Study Using Logistic Regression, SVC, Random Forest, and Gradient Boosting,” J. Digit. Mark. Digit. Curr., vol. 1, no. 1, pp. 21–42, 2024, doi: 10.47738/jdmdc.v1i1.4.

M. R. F. Rahmatullah, P. N. Andono, and M. A. Soeleman, “Improving Random Forest Performance for Sentiment Analysis on Unbalanced Data Using SMOTE and BoW Integration?: PLN Mobile Application Case Study,” vol. 12, no. 1, pp. 1–10, 2025, doi: 10.15294/sji.v12i1.19295.

T. Ahmed Khan, R. Sadiq, Z. Shahid, M. M. Alam, and M. Mohd Su’ud, “Sentiment Analysis using Support Vector Machine and Random Forest,” J. Informatics Web Eng., vol. 3, no. 1, pp. 67–75, 2024, doi: 10.33093/jiwe.2024.3.1.5.

A. Putriyekti et al., “Analisis Multidimensional Sentimen Masyarakat Terhadap Program Makan Bergizi Gratis Pada Media Sosial X.,” Integr. Perspect. Soc. Sci. J., vol. 2, no. 1, pp. 1004–1024, 2025.

I. G. Bintang, A. Budaya, and I. K. P. Suniantara, “Comparison of Sentiment Analysis Algorithms with SMOTE Oversampling and TF-IDF Implementation on Google Reviews for Public Health Centers,” MALCOM Indones. J. Mach. Learn. Comput. Sci., vol. 4, no. July, pp. 1077–1086, 2024, doi: https://doi.org/10.57152/malcom.v4i3.1459.

S. A. H. Bahtiar, C. K. Dewa, and A. Luthfi, “Comparison of Naïve Bayes and Logistic Regression in Sentiment Analysis on Marketplace Reviews Using Rating-Based Labeling,” J. Inf. Syst. Informatics, vol. 5, no. 3, pp. 915–927, Aug. 2023, doi: 10.51519/journalisi.v5i3.539.

Z. S. Munmun, S. Akter, and C. R. Parvez, “Machine Learning-Based Classification of Coronary Heart Disease: A Comparative Analysis of Logistic Regression, Random Forest, and Support Vector Machine Models,” OALib, vol. 12, no. 03, pp. 1–12, 2025, doi: 10.4236/oalib.1113054.

I. Septiana and D. Alita, “Perbandingan Random Forest dan SVM dalam Analisis Sentimen Quick Count Pemilu 2024,” J. Inform. J. Pengemb. IT, vol. 9, no. 3, pp. 224–233, 2024, doi: 10.30591/jpit.v9i3.6640.

F. Suandi et al., “Enhancing Sentiment Analysis Performance Using SMOTE and Majority Voting in Machine Learning Algorithms,” in Proceedings of the 7th International Conference on Applied Engineering (ICAE 2024), Atlantis Press International BV, 2024, pp. 126–138. doi: 10.2991/978-94-6463-620-8.

S. Peerbasha, A. Saleem Raja, Y. Mohammed Iqbal, and M. Surputheen, “Diabetes Prediction using Decision Tree, Random Forest, Support Vector Machine, K-Nearest Neighbors, Logistic Regression Classifiers,” 2023. doi: https://doi.org/10.46947/joaasr542023680.

A. A. Firdaus et al., “Application of Sentiment Analysis as an Innovative Approach to Policy Making: A Review,” J. Robot. Control, vol. 5, no. 6, pp. 1784–1798, 2024, doi: 10.18196/jrc.v5i6.22573.

T. V. S. Krishna, T. S. R. Krishna, S. Kalime, C. V. M. Krishna, S. Neelima, and R. R. Pbv, “A novel ensemble approach for Twitter sentiment classification with ML and LSTM algorithms for real-time tweets analysis,” Indones. J. Electr. Eng. Comput. Sci., vol. 34, no. 3, pp. 1904–1914, Jun. 2024, doi: 10.11591/ijeecs.v34.i3.pp1904-1914.

M. W. Arif, “Analisis Sentimen Kebijakan Makan Bergizi Gratis di Media Sosial Menggunakan Natural Language Processing Berbasis Python TextBlob di Indonesia Teknik Informatika , Universitas Ngudi Waluyo , Indonesia Sentiment Analysis of Free Nutritious Meal Policy on S,” vol. 5, no. 9, pp. 2463–2471, 2025, doi: https://doi.org/10.52436/1.jpti.931.

A. Fauzi et al., “Optimalisasi Random Forest untuk Sentimen Bahasa Indonesia dengan GridSearch dan SMOTE,” J. Ilmu Komput. dan Sist. Inf., vol. 4, no. 2, pp. 202–217, 2025, doi: https://doi.org/10.70340/jirsi.v4i2.207.

G. R. Ati and P. T. Prasetyaningrum, “Analysis of Community Sentiment Towards Free Nutrition Meal Programs on Twitter Using Naïve Bayes , Support Vector Machine , K-Nearest Neighbors , and Ensemble Methods,” vol. 7, no. 2, pp. 1443–1460, 2025, doi: 10.51519/journalisi.v7i2.1098.

Z. Purwanti, P. Studi Sistem Informasi, S. Tinggi Ilmu Komputer Cipta Karya Informatika, K. Jakarta Timur, and D. Khusus Ibukota Jakarta, “Pemodelan Text Mining untuk Analisis Sentimen Terhadap Program Makan Siang Gratis di Media Sosial X Menggunakan Algoritma Support Vector Machine (SVM),” 2024. doi: https://doi.org/10.35870/jimik.v5i3.1001.

M. Hanafi and M. Furqan, “Perbandingan Analisis Sentimen Presiden 2024 Menggunakan Algoritma Support Vector Machine dan K-Nearest Neighbor,” CESS (Journal Comput. Eng. Syst. Sci., vol. 10, no. 1, p. 275, 2025, doi: 10.24114/cess.v10i1.67747.

Published

2026-03-11

How to Cite

Prianto, S. E., Berlilana, B., & Saputro, R. E. (2026). Analisis Sentimen Program Makan Bergizi Gratis Menggunakan Random Forest dan Support Vector Machine dengan Penyeimbangan Data Berbasis SMOTE. Jurnal Pendidikan Dan Teknologi Indonesia, 6(2), 353-365. https://doi.org/10.52436/1.jpti.1491