مشروع تنظيف البيانات ومعالجتها بلغة بايثون
منذ أسبوعين
عرض العمل

الوصف
مشروع تنظيف بيانات العملاء المخزنة في صيغة ملف CSV يتكون من 7 أعمدة و 1000 صف.
الخدمات التي قدمتها باستخدام لغة Python.:
- إنشاء Pandas Data Frame لتحميل البيانات وعرضها.
- فحص البيانات للتحقق من حصة البيانات، أنواع البيانات، والقيم المفقودة.
- إعداد إحصاءات موجزة للأعمدة الرقمية، بعد ملء أو إزالة القيم المفقودة.
- تحويل العمود الخاص بالتاريخ من مجرد نص إلى نوع بيانات يناسب تنسيق التاريخ والوقت.
- تحويل الأعمدة الرقمية إلى أعداد صحيحة أو عشرية حسب طبيعة البيانات.
- توحيد القيم وتنسيق النص في الأعمدة غير الرقمية لتجهيزها للعرض.
- التحقق من الصفوف المكررة، وإزالة التكرارات من مجموعة البيانات.
- إنشاء عمود جديد للفئة العمرية حسب العمر، وعمود آخر للتصحيح نوع الجنس.
- إعادة تسمية أسماء الأعمدة الغامضة أو غير الواضحة لتسهيل الفهم.
- حفظ مجموعة البيانات المنظفة في ملف CSV جديد.
التفاصيل
المشاهدات | 1 |
المفضلة | 0 |
القسم | تدريب, تعليم و مساعدة عن بعد |
حساب المستخدم