Student Performance Factors
منذ أسبوع
عرض العمل
الوصف
الاستيراد والاستكشاف: استدعاء المكتبات البرمجية وإجراء تحليل استكشافي أولي (EDA) لفهم طبيعة البيانات.
معالجة المفقودات: معالجة القيم الفارغة باستخدام SimpleImputer (استراتيجية النمط الأكثر تكراراً).
القيم الشاذة: تحديد ومعالجة القيم المتطرفة (Outliers) باستخدام تقنية المدى الربيعي (IQR).
ترميز البيانات: تحويل المتغيرات الفئوية إلى قيم رقمية عبر OneHotEncoder وLabelEncoder.
التمثيل والتقسيم: تصور البيانات بيانياً وتقسيمها باستخدام StratifiedKFold لضمان توازن الفئات في كل قسم.
المعايرة (Normalization): تطبيق PowerTransformer لتحويل البيانات وتقريبها من التوزيع الطبيعي (Gaussian distribution).
النمذجة والتحسين: تطبيق 12 نموذج تصنيف (Classifiers)، متبوعاً بإجراء Grid Search وRandom Search لضبط المعلمات الفائقة واختيار النموذج الأمثل.
التفاصيل
| المشاهدات | 0 |
| المفضلة | 0 |
| القسم | برمجة, تطوير المواقع و التطبيقات - اخري |
حساب المستخدم
العربية
English