Analisis Prediksi Diabetes Menggunakan Decision Tree pada Dataset Diabetes Pima Indians

Authors

  • Noval Prayoga Sistem Informasi, Sains dan Teknologi, Universitas Ibrahimy, Situbondo, Indonesia
  • Muhammad Ali Ridla Sistem Informasi, Sains dan Teknologi, Universitas Ibrahimy, Situbondo, Indonesia

DOI:

https://doi.org/10.26905/jisad.v4i1.16494

Keywords:

Decision Tree;, Prediksi Diabetes;, Pima Indians Diabetes Dataset;, klasifikasi;

Abstract

Diabetes melitus merupakan penyakit persisten dengan insidensi yang terus meningkat di seluruh dunia, sehingga strategi deteksi dini yang tepat menjadi sangat penting. Penelitian ini bertujuan untuk memprediksi risiko diabetes menggunakan algoritma Selection Tree yang berbasis pada Pima Indians Diabetes Dataset. Tahapan penelitian meliputi prapemrosesan data, penanganan nilai yang tidak valid, normalisasi, pemisahan data, dan pelatihan model menggunakan kriteria pemisahan gini dan entropi. Pengembangan kinerja dilakukan melalui optimasi hiperparameter menggunakan GridSearchCV dan penyeimbangan data dengan SMOTE. Hasilnya menunjukkan bahwa model Selection Tree yang dioptimalkan memberikan akurasi tinggi, interpretabilitas yang kuat, dan kemampuan untuk mengidentifikasi variabel yang paling berpengaruh terkait dengan risiko diabetes. Temuan ini menegaskan bahwa Selection Tree yang dikombinasikan dengan strategi optimasi dan penyeimbangan data merupakan teknik yang efektif untuk deteksi dini diabetes.

Downloads

Download data is not yet available.

References

[1] M. F. Aditya, A. Pramuntadi, D. P. Wijaya, And Y. Wicaksono, “Implementasi Metode Decision Tree Pada Prediksi Penyakit Diabetes Melitus Tipe 2,” Malcom Indones. J. Mach. Learn. Comput. Sci., Vol. 4, No. 3, Pp. 1104–1110, 2024, Doi: 10.57152/Malcom.V4i3.1284.

[2] M. Guo Et Al., “Normal Workflow And Key Strategies For Data Cleaning Toward Real-World Data: Viewpoint,” Interact. J. Med. Res., Vol. 12, P. E44310, 2023, Doi: 10.2196/44310.

[3] S. C. Gupta And N. Goel, “Predictive Modeling And Analytics For Diabetes Using Hyperparameter Tuned Machine Learning Techniques,” Procedia Comput. Sci., Vol. 218, No. 2022, Pp. 1257–1269, 2022, Doi: 10.1016/J.Procs.2023.01.104.

[4] Y. Kim, A. Kwon, K. Kang, And B. A. Kwon, “Assessing The Impact Of Data Impurity Measures On Decision Tree Algorithms In Spam Classification,” J. Artif. Intell. Res. Appl., Vol. 15588, Pp. 33–46, 2024.

[5] R. Maulana And E. Eliyani, “Diabetes Classification Algorithm Optimization Using Particle Swarm Optimization On Naïve Bayes, C4.5 And Random Forest,” J. Sisfokom (Sistem Inf. Dan Komputer), Vol. 14, No. 4, Pp. 499–509, 2025, Doi: 10.32736/Sisfokom.V14i4.2431.

[6] M. A. Nasution, Z. A. Ulumuddin, And A. Fitri, “Analisis Faktor Risiko Diabetes Melitus Menggunakan Algoritma C4.5: Implementasi Pada Aplikasi Orange,” J. Sains Teknol. Dan Komput., Vol. 1, No. 3, Pp. 75–79, 2024.

[7] A. Perdana, A. Hermawan, And D. Avianto, “Analyze Important Features Of Pima Indian Database For Diabetes Prediction Using Knn,” J. Sisfokom (Sistem Inf. Dan Komputer), Vol. 12, No. 1, Pp. 70–75, 2023, Doi: 10.32736/Sisfokom.V12i1.1598.

[8] M. N. Raihen And S. Akter, “Comparative Assessment Of Several Effective Machine Learning Classification Methods For Maternal Health Risk,” Comput. J. Math. Stat. Sci., Vol. 3, No. 1, Pp. 161–176, 2024, Doi: 10.21608/Cjmss.2024.259490.1036.

[9] L. Safitri And Z. Fatah, “Implementasi Prediksi Penyakit Diabetes Menggunakan Metode Decision Tree,” Jusifor J. Sist. Inf. Dan Inform., Vol. 3, No. 2, Pp. 125–132, 2024, Doi: 10.70609/Jusifor.V3i2.5788.

[10] P. Studi, S. Informasi, F. Sains, And U. Ibrahimy, “Klasifikasi Gangguan Tidur Berdasarkan Gaya Hidup Menggunakan Algoritma Decision Tree Classification Of Sleep Disorders Based On Lifestyle Using Decision Tree Algorithm,” Vol. 3, No. 2, Pp. 118–125, 2025, Doi: 10.26905/Jisad.V3i2.16038.

[11] Ö. Şen, S. Bozkurt Keser, And K. Keskin, “Early Stage Diabetes Prediction Using Decision Tree-Based Ensemble Learning Model,” Int. Adv. Res. Eng. J., Vol. 7, No. 1, Pp. 62–71, 2023, Doi: 10.35860/Iarej.1188039.

[12] A. Afifuddin And L. Hakim, “Deteksi Penyakit Diabetes Mellitus Menggunakan Algoritma Decision Tree Model Arsitektur C4.5,” J. Krisnadana, Vol. 3, No. 1, Pp. 25–33, 2023, Doi: 10.58982/Krisnadana.V3i1.470.

[13] S. Bukhari And S. Mohamed, “Journal Of Advanced Applied Scientific Research - Issn:2454- 3225 Suganthi P,” Vol. 5, No. Dl, Pp. 68–83, 2025.

[14] V. Lopatka, I. Meniailov, And K. Bazilevych, “Classification And Prediction Of Diabetes Disease Using Modified K-Neighbors Method,” 2021 Ieee 12th Int. Conf. Electron. Inf. Technol. Elit 2021 - Proc., Vol. 2836, Pp. 46–50, 2021, Doi: 10.1109/Elit53502.2021.9501151.

[15] I. Z. Sadiq Et Al., “Data-Driven Diabetes Mellitus Prediction And Management: A Comparative Evaluation Of Decision Tree Classifier And Artificial Neural Network Models Along With Statistical Analysis,” Sci. Rep., Vol. 15, No. 1, Pp. 1–16, 2025, Doi: 10.1038/S41598-025-03718-W.

Downloads

Published

2026-03-31

Issue

Section

Articles