Peningkatan Akurasi Prediksi Penyakit Jantung dengan Teknik SMOTEENN pada Algoritma Random Forest

Authors

  • Alfin Rahmada Sistem Informasi, Fakultas Teknik dan Ilmu Komputer, Universitas Teknokrat Indonesia, Indonesia
  • Erliyan Redy Susanto Sistem Informasi, Fakultas Teknik dan Ilmu Komputer, Universitas Teknokrat Indonesia, Indonesia

DOI:

https://doi.org/10.52436/1.jpti.524

Keywords:

Ketidakseimbangan Data, Machine Learning, Penyakit Jantung, Random Forest, SMOTEENN

Abstract

Penyakit jantung merupakan salah satu penyebab utama kematian di dunia yang dapat mengancam nyawa jika tidak ditangani dengan tepat. Bahaya penyakit ini meliputi serangan jantung mendadak, gagal jantung, hingga stroke akibat komplikasi pembuluh darah. Masalah utama yang dihadapi dalam studi ini adalah akurasi prediksi  penyakit jantung saat ini masih cukup rendah sehingga belum layak untuk diimplementasikan dalam bentuk program komputer. Penelitian ini bertujuan untuk meningkatkan akurasi prediksi penyakit jantung dengan menggunakan metode machine learning. Dalam studi ini kami menggunakan algoritma Random Forest dan mengintegrasikan teknik SMOTEENN (Synthetic Minority Oversampling Technique and Edited Nearest Neighbor) ke dalam algoritma. Hasil studi menunjukkan bahwa performa metode yang kami gunakan lebih baik dari studi sebelumnya, dari 86% menjadi 94%. Penerapkan teknik SMOTEENN pada algoritma Random Forest berhasil meningkatkan akurasi prediksi penyakit jantung secara signifikan. Penelitian ini berkontibusi dalam meningkatkan keakuratan model prediksi medis berbasis machine learning untuk mendukung proses diagnosa klinis penyakit jantung.

Downloads

Download data is not yet available.

References

L. A. Sposato et al., “Post-Stroke Cardiovascular Complications and Neurogenic Cardiac Injury,” J. Am. Coll. Cardiol., vol. 76, no. 23, pp. 2768–2785, Dec. 2020, doi: 10.1016/j.jacc.2020.10.009.

A. Kumari, A. P. Singh, and C. V. Obiajulu, “Exploring the Relationship Between Muscle-Enhancing Steroids and Heart Attacks: A Comprehensive Overview,” Int. J. Pharm. Res. Allied Sci., vol. 13, no. 3, pp. 19–34, 2024, doi: 10.51847/yzw5XWDJwZ.

F. Yulidasari, H. Salsabila, G. A. Sedar, G. A. N. Putri, H. Putery, and H. A. Zawary, “PENYULUHAN METODE ”CERDIK” SEBAGAI UPAYA PENGENDALIAN HIPERTENSI DI DESA WONOREJO RT 7 DAN 9 KECAMATAN SATUI,” SELAPARANG J. Pengabdi. Masy. Berkemajuan, vol. 7, no. 2, p. 1300, Jun. 2023, doi: 10.31764/jpmb.v7i2.15214.

C. Shao, J. Wang, J. Tian, and Y. Tang, “Coronary Artery Disease: From Mechanism to Clinical Practice,” Springer, Singapore, 2020, pp. 1–36. doi: 10.1007/978-981-15-2517-9_1.

H. Haryanto, “Analisis Big Data dan Artificial Intelligence (AI): dalam Industri Khususnya Prediksi Penyakit Jantung dengan Phyton,” Go Infotech J. Ilm. STMIK AUB, vol. 30, no. 1, pp. 76–86, Jun. 2024, doi: 10.36309/goi.v30i1.262.

P. Mathur, S. Srivastava, X. Xu, and J. L. Mehta, “Artificial Intelligence, Machine Learning, and Cardiovascular Disease,” Clin. Med. Insights Cardiol., vol. 14, p. 117954682092740, Jan. 2020, doi: 10.1177/1179546820927404.

H. M. Iskandar, “ANALISIS KOMUNIKASI PASIEN DENGAN DOKTER PADA APLIKASI KONSULTASI KESEHATAN BERBASIS ARTIFICIAL INTELEGENCE AICARE,” J. Pariwara, vol. 4, no. 1, pp. 9–19, Jan. 2024, doi: 10.31294/pariwara.v4i1.5641.

I. Castiglioni et al., “AI applications to medical images: From machine learning to deep learning,” Phys. Medica, vol. 83, pp. 9–24, Mar. 2021, doi: 10.1016/j.ejmp.2021.02.006.

M. Tiara Triani Br Sirait, N. Siti Fathonah, and M. Nurkamal Fauzan, “PEMANFAATAN ALGORITMA ADASYN DAN SUPPORT VECTOR MACHINE DALAM MENINGKATKAN AKURASI PREDIKSI KANKER PARU-PARU,” JATI (Jurnal Mhs. Tek. Inform., vol. 8, no. 5, pp. 8773–8778, Sep. 2024, doi: 10.36040/jati.v8i5.10752.

F. Thabtah, S. Hammoud, F. Kamalov, and A. Gonsalves, “Data imbalance in classification: Experimental evaluation,” Inf. Sci. (Ny)., vol. 513, pp. 429–441, Mar. 2020, doi: 10.1016/j.ins.2019.11.004.

A. A. G. W. S. Erlangga, I. G. A. Gunadi, and I. M. G. Sunarya, “Kombinasi Oversampling dan Undersampling dalam Menangani Class Imbalanced dan Overlapping pada Klasifikasi Data Bank Marketing,” J. Resist. (Rekayasa Sist. Komputer), vol. 7, no. 1, pp. 32–42, Apr. 2024, doi: 10.31598/jurnalresistor.v7i1.1515.

N. F. Sahamony, T. Terttiaavini, and H. Rianto, “Analisis Perbandingan Kinerja Model Machine Learning untuk Memprediksi Risiko Stunting pada Pertumbuhan Anak,” MALCOM Indones. J. Mach. Learn. Comput. Sci., vol. 4, no. 2, pp. 413–422, Feb. 2024, doi: 10.57152/malcom.v4i2.1210.

A. S. Prabowo and F. I. Kurniadi, “Analisis Perbandingan Kinerja Algoritma Klasifikasi dalam Mendeteksi Penyakit Jantung,” J. SISKOM-KB (Sistem Komput. dan Kecerdasan Buatan), vol. 7, no. 1, pp. 56–61, Oct. 2023, doi: 10.47970/siskom-kb.v7i1.468.

A. Kurani, P. Doshi, A. Vakharia, and M. Shah, “A Comprehensive Comparative Study of Artificial Neural Network (ANN) and Support Vector Machines (SVM) on Stock Forecasting,” Ann. Data Sci., vol. 10, no. 1, pp. 183–208, Feb. 2023, doi: 10.1007/s40745-021-00344-x.

A. P. Rodrigues et al., “Real-Time Twitter Spam Detection and Sentiment Analysis using Machine Learning and Deep Learning Techniques,” Comput. Intell. Neurosci., vol. 2022, pp. 1–14, Apr. 2022, doi: 10.1155/2022/5211949.

M. Raka Sujono, A. Bahtiar, and B. Irawan, “ANALISIS MODEL MACHINE LEARNING UNTUK JENIS ASPAL DI JAWA BARAT MENGGUNAKAN ALGORITMA DECISION TREE DAN RANDOM FOREST,” JATI (Jurnal Mhs. Tek. Inform., vol. 7, no. 6, pp. 3886–3891, Feb. 2024, doi: 10.36040/jati.v7i6.8275.

J. Yang and J. Guan, “A Heart Disease Prediction Model Based on Feature Optimization and Smote-Xgboost Algorithm,” Information, vol. 13, no. 10, p. 475, Oct. 2022, doi: 10.3390/info13100475.

A. Seva, S. N. Tirumala Rao, and M. Sireesha, “Prediction of Liver Disease with Random Forest Classifier Through SMOTE-ENN Balancing,” in 2024 IEEE 13th International Conference on Communication Systems and Network Technologies (CSNT), IEEE, Apr. 2024, pp. 928–933. doi: 10.1109/CSNT60213.2024.10546170.

F. Handayani, “Komparasi Support Vector Machine, Logistic Regression Dan Artificial Neural Network Dalam Prediksi Penyakit Jantung,” J. Edukasi dan Penelit. Inform., vol. 7, no. 3, p. 329, Dec. 2021, doi: 10.26418/jp.v7i3.48053.

W. Nugraha, R. Sabaruddin, and S. Murni, “Teknik Scaling Menggunakan Robust Scaler Untuk Mengatasi Outlier Data Pada Model Prediksi Serangan Jantung,” Techno.Com, vol. 23, no. 2, pp. 319–327, May 2024, doi: 10.62411/tc.v23i2.10463.

C. Shao, J. Wang, J. Tian, and Y. Tang, “Coronary Artery Disease: From Mechanism to Clinical Practice,” Springer Nature Singapore Pte Ltd., 2020, pp. 1–36. doi: 10.1007/978-981-15-2517-9_1.

O. O. Palit et al., “Akurasi Metode Mesin Pembelajaran dalam Analisis Variabel Penting Faktor Risiko Sindrom Down,” Indones. J. Comput. Sci., vol. 13, no. 5, Oct. 2024, doi: 10.33022/ijcs.v13i5.4354.

A. Nautiyal and A. K. Mishra, “Drill Bit Selection and Drilling Parameter Optimization using Machine Learning,” IOP Conf. Ser. Earth Environ. Sci., vol. 1261, no. 1, p. 012027, Dec. 2023, doi: 10.1088/1755-1315/1261/1/012027.

J. Li, Q. Zhu, Q. Wu, and Z. Fan, “A novel oversampling technique for class-imbalanced learning based on SMOTE and natural neighbors,” Inf. Sci. (Ny)., vol. 565, pp. 438–455, Jul. 2021, doi: 10.1016/j.ins.2021.03.041.

M. H. Jamal, N. Naz, M. A. K. Khattak, F. Saeed, S. N. Altamimi, and S. N. Qasem, “A Comparison of Re-Sampling Techniques for Detection of Multi-Step Attacks on Deep Learning Models,” IEEE Access, vol. 11, pp. 127446–127457, 2023, doi: 10.1109/ACCESS.2023.3332512.

T. S. Albalawi, “Heart-SecureCloud: A Secure Cloud-Based Hybrid DL System for Diagnosis of Heart Disease Through Transformer-Recurrent Neural Network,” Int. J. Adv. Comput. Sci. Appl., vol. 15, no. 9, 2024, doi: 10.14569/IJACSA.2024.0150916.

R. Hayami, Soni, and I. Gunawan, “Klasifikasi Jamur Menggunakan Algoritma Naïve Bayes,” J. CoSciTech (Computer Sci. Inf. Technol., vol. 3, no. 1, pp. 28–33, May 2022, doi: 10.37859/coscitech.v3i1.3685.

M. R. Maulana, A. Sucipto, and H. M. Mulyo, “OPTIMISASI PARAMETER SUPPORT VECTOR MACHINE DENGAN PARTICLE SWARM OPTIMIZATION UNTUK PENINGKATAN KLASIFIKASI DIABETES,” J. Inform. Teknol. dan Sains, vol. 6, no. 4, pp. 802–812, Nov. 2024, doi: 10.51401/jinteks.v6i4.4784.

Y. K. Bintang and H. Imaduddin, “PENGEMBANGAN MODEL DEEP LEARNING UNTUK DETEKSI RETINOPATI DIABETIK MENGGUNAKAN METODE TRANSFER LEARNING,” JIPI (Jurnal Ilm. Penelit. dan Pembelajaran Inform., vol. 9, no. 3, pp. 1442–1455, Aug. 2024, doi: 10.29100/jipi.v9i3.5588.

I. D. Mienye and Y. Sun, “Effective Feature Selection for Improved Prediction of Heart Disease,” 2022, pp. 94–107. doi: 10.1007/978-3-030-93314-2_6.

N. L. Fitriyani, M. Syafrudin, G. Alfian, C. Yang, J. Rhee, and S. M. Ulyah, “Chronic Disease Prediction Model Using Integration of DBSCAN, SMOTE-ENN, and Random Forest,” in 2022 ASU International Conference in Emerging Technologies for Sustainability and Intelligent Systems (ICETSIS), IEEE, Jun. 2022, pp. 289–294. doi: 10.1109/ICETSIS55481.2022.9888806.

A. U. Nandhini and K. Dharmarajan, “Random forest and genetic algorithm united with hyperparameter for diabetes prediction by using WBSMOTE, wrapper approach,” Int. J. Syst. Syst. Eng., vol. 13, no. 2, pp. 207–227, 2023, doi: 10.1504/IJSSE.2023.131226.

Published

2025-01-19

How to Cite

Rahmada, A. ., & Susanto, E. R. (2025). Peningkatan Akurasi Prediksi Penyakit Jantung dengan Teknik SMOTEENN pada Algoritma Random Forest. Jurnal Pendidikan Dan Teknologi Indonesia, 4(12), 795-803. https://doi.org/10.52436/1.jpti.524