Analisis prediksi penyakit jantung menggunakan regresi logistik dengan R Studio
P enyakit kardiovaskular atau jantung adalah sekelompok penyakit yang disebabkan oleh gangguan pada jantung dan pembuluh darah. Ikatan Dokter Indonesia (IDI) menyebut, terdapat. sekitar 17 juta kematian per tahun akibat penyakit jantung dan merupakan 31% dari seluruh total kematian di dunia. Angka ini diprediksi akan terus meningkat hingga 23 juta kematian per tahun di 2030, bahkan di Indonesia. penyakit jantung ini menjadi beban biaya terbesar. Berdasarkan data BPJS Kesehatan pada 2021 pembiayaan. kesehatan terbesar ada pada penyakit jantung sebesar Rp.7,7 triliun. Pada penelitian ini bertujuan untuk melakukan analisis prediksi penyakit jantung menggunakan Regresi Logistik Dengan R Studio. Dataset penelitian ini diambil melalui dataset dari Kaggle yang disurvei oleh CDC (Centers for Disease Control and Prevention) sepanjang tahun 2020, dengan pengolahannya menggunakan software R Studio. Pada tahap awal data diinput dan melakukan preparation data, setelah itu melakukan statistika deskriptif. Tahapan selanjutnya membagi data set untuk dijadikan data train sebesar 80% dan tes 20%, setelah itu mencari pemilihan sampling data terbaik, selanjutnya membuat model regresi logistik yang terbaik dan melakukan prediksi. Terakhir melakukan confusion matrix, didapatkan dari proses analisa keseluruhan data yaitu dengan spesifikasi model sebesar 0.78, presisi model sebesar 0.22, dan tingkat akurasi sebesar 0.75 atau 75 %. Diakhir penelitian, pada penelitian ini dilakukan perancangan dashboard dengan R-Shiny untuk membantu individu yang ingin mengetahui hasil analisis prediksi penyakit jantung, supaya model yang dibuat dapat lebih bermanfaat.Kata
C ardiovascular or heart disease refers to a group of diseases caused by disturbances in the heart and blood vessels. The Indonesian Medical Association (IDI) states that approximately 17 million deaths occur annually due to heart disease, accounting for 31% of all deaths worldwide. This number is predicted to rise to 23 million deaths annually by 2030. In Indonesia, this disease poses the most significant financial burden. According to BPJS Kesehatan data in 2021, the highest health expenditure is allocated to heart disease, amounting to IDR 7.7 trillion. This research aims to predict heart disease using Logistic Regression with R Studio. The dataset for this study was sourced from Kaggle, which was surveyed by the CDC (Centers for Disease Control and Prevention) throughout 2020 and processed using the R Studio software. In the initial phase, the data is inputted and undergoes data preparation, followed by descriptive statistics. The next step divides the dataset into 80% for training and 20% for testing, then selects the best data sampling method, creates the best logistic regression model, and makes predictions. Finally, by using a confusion matrix, the overall data analysis revealed a model specification of 0.78, model precision of 0.22, and an accuracy rate of 0.75 or 75%. At the end of the study, a dashboard was designed using R-Shiny to assist individuals wanting to understand the predictive analysis results for heart disease, ensuring the developed model can be more beneficial.