Optimasi Analisis Sentimen Lowongan Kerja di Twitter Dengan XGBoost-Vader dan Evaluasi SMOTE Borderline

Penulis

  • Luthfi Ja'far Teknik Informatika, Universitas Dian Nuswantoro, Indonesia
  • L. Budi Handoko Teknik Informatika, Universitas Dian Nuswantoro, Indonesia

DOI:

https://doi.org/10.52436/1.jpti.741

Kata Kunci:

Analisis Sentimen, Lowongan Kerja, SMOTE Borderline, VADER, XGBoost

Abstrak

Perkembangan komunikasi digital telah menjadikan Twitter sebagai platform utama dalam rekrutmen di Indonesia. Namun, analisis sentimen pada platform ini masih jarang diterapkan secara optimal, padahal dapat memberikan wawasan penting bagi pencari kerja dan perekrut dalam memahami persepsi publik terhadap lowongan kerja. Penelitian ini mengembangkan model analisis sentimen menggunakan XGBoost dan VADER untuk mengklasifikasikan postingan lowongan kerja berbahasa Indonesia ke dalam tiga kategori: positif, negatif, dan netral. Dataset terdiri dari 2.181 postingan, dengan rincian 1.711 netral, 414 positif, dan 56 negatif. Untuk menangani ketidakseimbangan data, diterapkan Synthetic Minority Over-sampling Technique (SMOTE) Borderline, yaitu teknik penyeimbangan data yang secara selektif menghasilkan sampel sintetis pada batas keputusan. Namun, teknik ini tidak meningkatkan akurasi model secara signifikan. Sebelum tuning, akurasi model konsisten di 99,95% hingga 100%, sementara setelah tuning, akurasi awalnya sedikit lebih rendah tetapi kemudian stabil di 100%. Evaluasi menggunakan classification report, confusion matrix, dan Stratified K-Fold Cross Validation menunjukkan bahwa model tetap stabil dan mampu menggeneralisasi data dengan baik tanpa indikasi overfitting. Dibandingkan pendekatan sebelumnya, penelitian ini menunjukkan bahwa kombinasi XGBoost dan VADER tanpa balancing data tambahan tetap mampu memberikan analisis sentimen yang lebih akurat dan stabil untuk platform lowongan kerja di Indonesia. Hasil ini berkontribusi dalam pengembangan model analisis sentimen berbasis machine learning yang lebih sesuai dengan karakteristik bahasa Indonesia, serta membuka peluang penelitian lebih lanjut dalam analisis opini publik di media sosial.

Unduhan

Data unduhan belum tersedia.

Referensi

U. R. dan S. Yana, “Pengaruh Media Sosial Dalam Transformasi Pemasaran Digital,” JUPEIS: Jurnal Pendidikan dan Ilmu Sosial , vol. 3, no. 3, pp. 11-17, 2024

D. I. A. Putri, F. T. Saputra dan R. Hardiyanti, “Pengaruh Penggunaan Media Sosial Twitter Terhadap Pemenuhan Kebutuhan,” Jurnal Ilmiah Wahana Pendidikan, vol. 10, no. 8, pp. 410-418, 2024.

1 U. R. dan S. Yana, “Pengaruh Media Sosial Dalam Transformasi Pemasaran Digital,” JUPEIS: Jurnal Pendidikan dan Ilmu Sosial , vol. 3, no. 3, pp. 11-17, 2024.

R. K. Pratama dan P. W. Setyaningsih, “Analisis Komentar Pada Twitter Terhadap Lapangan Kerja,” JURNAL INFORMATION SYSTEM & ARTIFICIAL INTELLIGENCE, vol. 3, no. 2, pp. 217-227, 2023.

A. Marcellino, Y. C. Moniung dan R. , “Penerapan Teknik SMOTE Pada Analisis Sentimen Bea,” Jurnal Algoritme, vol. 4, no. 2, pp. 75-84, 2024.

R. Asyaroh dan A. S. Fitriani, “Sentiment Analysis on Twitter About Domestic Violence Using Random,” KESATRIA: Jurnal Penerapan Sistem Informasi (Komputer & Manajemen), vol. 4, no. 4, pp. 1-9, 2023.

R. E. H. Hermaliani dan M. Ernawati, “Penerapan Metode SMOTE Untuk Mengatasi Imbalanced Data Pada,” Computer Science (CO-SCIENCE), vol. 4, no. 1, pp. 80-88, 2024.

W. Kurniawan dan U. Indahyanti, “Prediksi Angka Harapan Hidup Penduduk Menggunakan,” Indonesian Journal of Applied Technology, vol. 1, no. 4, pp. 1-8, 20224.

R. Aryanti, T. Misriati dan R. Hidayat, “Klasifikasi Risiko Kesehatan Ibu Hamil Menggunakan Random,” KLIK: Kajian Ilmiah Informatika dan Komputer, vol. 3, no. 5, pp. 409-416, 2023.

J. M. A. S. Dachi dan P. Sitompul, “Analisis Perbandingan Algoritma XGBoost dan Algoritma,” Jurnal Riset Rumpun Matematika dan Ilmu Pengetahuan Alam (JURRIMIPA), vol. 2, no. 2, pp. 87-103, 2023.

K. Akbar dan M. Hayaty, “Data Balancing untuk Mengatasi Imbalance Dataset pada,” Jurnal Ilmiah Intech : Information Technology Journal of UMUS, vol. 2, no. 2, pp. 1-14, 2020.

R. N. Ilyas, S. Mulyani, S. Wiguna dan M. Ramli, “Penggunaan Crawling Data X dengan Menggunakan Tweet,” TECHNOPEX-2024 Institut Teknologi Indonesia, pp. 851-856, 2024.

S. Khairunnisa, A. dan S. Al Faraby, “Pengaruh Text Preprocessing terhadap Analisis Sentimen Komentar,” JURNAL MEDIA INFORMATIKA BUDIDARMA, vol. 5, no. 2, pp. 406-414, 2021.

T. Ridwansyah, “Implementasi Text Mining Terhadap Analisis Sentimen Masyarakat Dunia,” KLIK: Kajian Ilmiah Informatika dan Komputer, vol. 2, no. 5, pp. 178-185, 2022.

Z. A. Sriyanti, D. Y. K. Kartika dan A. R. E. Najaf, “Implementasi Model BERT Pada Analisis Sentimen Pengguna Twitter Terhadap Aksi Boikot Israel,” JITET (Jurnal Informatika dan Teknik Elektro Terapan), vol. 12, no. 3, pp. 2335-2342, 2023.

U. L. Yuhana, A. Purwarianti dan I. , “Tuning Hyperparameter pada Gradient Boosting untuk Klasifikasi Soal Cerita Otomatis,” JEPIN (Jurnal Edukasi dan Penelitian Informatika), vol. 8, no. 1, pp. 134-139, 2022.

B. Ramadhan dan F. S. Pane, “Pengaruh Hyperparameter Tuning untuk Efektivitas pada Pendekatan Hybrid dalam Mendiagnosis Stres dan Depresi: Tinjauan Studi Literatur,” Jurnal Tekno Insentif, vol. 18, no. 2, pp. 104-118, 2024.

##submission.downloads##

Diterbitkan

2025-04-20

Cara Mengutip

Ja’far, L., & Handoko, L. B. (2025). Optimasi Analisis Sentimen Lowongan Kerja di Twitter Dengan XGBoost-Vader dan Evaluasi SMOTE Borderline. Jurnal Pendidikan Dan Teknologi Indonesia, 5(4), 999-1010. https://doi.org/10.52436/1.jpti.741