Student Performance Factors

منذ أسبوع

عرض العمل

الوصف

الاستيراد والاستكشاف: استدعاء المكتبات البرمجية وإجراء تحليل استكشافي أولي (EDA) لفهم طبيعة البيانات.

معالجة المفقودات: معالجة القيم الفارغة باستخدام SimpleImputer (استراتيجية النمط الأكثر تكراراً).

القيم الشاذة: تحديد ومعالجة القيم المتطرفة (Outliers) باستخدام تقنية المدى الربيعي (IQR).

ترميز البيانات: تحويل المتغيرات الفئوية إلى قيم رقمية عبر OneHotEncoder وLabelEncoder.

التمثيل والتقسيم: تصور البيانات بيانياً وتقسيمها باستخدام StratifiedKFold لضمان توازن الفئات في كل قسم.

المعايرة (Normalization): تطبيق PowerTransformer لتحويل البيانات وتقريبها من التوزيع الطبيعي (Gaussian distribution).

النمذجة والتحسين: تطبيق 12 نموذج تصنيف (Classifiers)، متبوعاً بإجراء Grid Search وRandom Search لضبط المعلمات الفائقة واختيار النموذج الأمثل.


التفاصيل

المشاهدات 0
المفضلة 0
القسم برمجة, تطوير المواقع و التطبيقات - اخري

حساب المستخدم

Developed by Samer Zaki

All rights reserved © kaf 2026