Home < Articles < Article Details
Advancing diabetes disease prediction: a comprehensive approach using machine learning and expert knowledge
| Researcher(s): | - Jazya Moftah Ahmad Amshaher
|
| Institution: | Sirt University, Libya |
| Field: | Computer science, expert systems and information technology |
| Published in: | 38th volume - April 2026 |
الملخص
مع الزيادة القوية في البيانات المتعلقة بالرعاية الصحية، هناك العديد من التحديات التي قد تعترض تحسن النتائج السريرية. من التحديات التي يشكل تحديًا كبيرًا هو تحديد العلاقات بين الخصائص المرضية والأمراض والعواقب السريرية من خلال تحليل كميات ضخمة من السجلات الصحية الإلكترونية. بالرغم من وجود العديد من خوارزميات التعلم الآلي المقترحة للأمراض، الكثير من الأساليب الموجودة حالياً لا تحقق درجة عالية من الدقة. النقطة الرئيسية لجميع هذه الأساليب هي أنها تشترك في الاهتمام بخوارزمية التنبؤ، مما يعني غالباً إهمال بعض الجوانب الهامة مثل اختيار الميزات وترجيحها. نتيجة لوجود هذه العيوب، يكون العديد من النماذج الخاصة بالتنبؤ ضعيف.
وتجسد هذه الورقة جهدنا في التغلب على هذه المعوقات بتطوير نموذج تنبؤ محسّن لمرض السكري باستخدام التعلم الآلي ومعرفة المجال. وتعالج الورقة الاستفادة من خوارزمية أقرب جار (KNN) لأمراض السكري. ستستفيد من الامتياز في مجال معرفة للمساعدة في اختيار. سيستخدم هذا النظام الخبرة في المجال للمساعدة في اختيار وترجيح الميزات ذات الصلة من مجموعة البيانات الكبيرة لبيانات مرض السكري، وكانت النتائج النهائية للدقة 72.73%، والدقة 62.50%، والاستدعاء 55.56%، والمساحة تحت المنحنى (AUC) 78.31%، ودرجة F1 58.82%...............
الكلمات المفتاحية:......... مرض السكري، التعلم الآلي، التنبؤ بالأمراض، اختيار الميزات.
Abstract
The swift expansion of healthcare data has presented significant hurdles for improving clinical outcomes. Identifying the relationships between patient characteristics, medical records, and disease outcomes using large volumes of Electronic Health Records (EHRs) is one of the challenges faced. Although several machine learning algorithms have been suggested to predict diseases, many existing methods are still not sufficiently accurate. The primary disadvantage of these methods is their emphasis on the prediction algorithm, which often overlooks crucial aspects like feature selection and weighting. Due to these shortcomings, predictive models may not be as effective.
To overcome these obstacles, this research seeks to develop an improved framework for predicting diseases by employing machine learning methods and domain knowledge. This paper investigates the utilization of K-Nearest Neighbor's (KNN) algorithm for predicting diseases. It will use domain expertise to help choose and weight relevant features from the large dataset of diabetes data and the resulting performance for accuracy was 72.73%, Precision 62.50%, Recall 55.56%, area under the curve (AUC) 78.31%, and F1-Score 58.82%..................
Keywords: ................Diabetic Disease, Machine Learning, Disease Prediction, feature selection.