International Science and Technology Journal

Home < Articles < Article Details

Evaluating Automobile Quality Using the Random Forest Algorithm

الملخص
التعلم الآلي يستخدم أساليب المجموعة، حيث يُشار إلى النماذج الأصغر التي يتم دمجها لتكوين نموذج المجموعة بالنماذج الأساسية. غالبًا ما تؤدي أساليب المجموعة إلى أداء أعلى بكثير مما يمكن أن يحققه أي من النماذج الأساسية الفردية. تكمن مشكلة الدراسة في أن نتائج الدراسات السابقة للتنبؤ بجودة السيارة باستخدام خوارزمية k-means كانت من خلال تصنيف الخصائص الستة لمواصفات السيارة (الشراء، الصيانة، الأبواب، الأشخاص، صندوق الأمتعة، السلامة)، بحيث يتم تقييم جودتها وتكون النتيجة باستخدام خوارزمية 56% k-means فقط . لذا، تقدم هذه الدراسة وصفًا لتقييم جودة السيارات بناءً على خوارزمية الغابة العشوائية من خلال تصنيف الخصائص الستة لمواصفات السيارة، بحيث يتم تقييم جودتها عن طريق برنامج بايثون. في هذا البحث، تسمى طريقة التجميع بالتعبئة، وهي اختصار لتجميع التمهيد. تقوم عملية التعبئة ببناء نماذج أساسية متعددة مع بيانات تدريب مُعاد تشكيلها مع الاستبدال. أثناء تحليل ومقارنة نتائج خوارزمية الغابة العشوائية مع نتائج خوارزمية k-means، كانت نتائج خوارزمية الغابة العشوائية أفضل من خوارزمية k-means التي لها نفس مجموعة البيانات، وبلغت نسبة دقة خوارزمية الغابة العشوائية 98.07% بينما بلغت دقة خوارزمية 56% k-means.................. الكلمات المفتاحية:................ الغابة العشوائية، جودة السيارات، خوارزمية K-means.
Abstract
Machine Learning uses ensemble methods, where the smaller models that are combined to form the ensemble model are referred to as basic models. Ensemble methods often result in considerably higher performance than any of the individual base models could achieve. The problem with the study is that the results of previous studies of car quality prediction using the K-means algorithm was by classifying the six characteristics of car specifications (buying, maint, doors, persons, lug_boot, safety), so that its quality is evaluated and the result using the K-means algorithm is Only 56%. so, this study presents a description of the quality assessment of cars based on the random forest algorithm by classifying the six characteristics of the car specifications, so that their quality is evaluated by the Python program. In this research, the ensemble method is called bagging, which is short for bootstrap aggregating. Bagging builds multiple base models with resampled training data with replacement. During the analysis and comparison of the results of the random forest algorithm with the results of the k-means algorithm, the results of the random forest algorithm were better than the k-means algorithm with the same data set, the accuracy of the random forest algorithm was 98.07%, while the accuracy of the k-means algorithm was 56%. ................. Keywords:.............. random forest, automobile quality, K-means algorithm.