الفئات: العلوم والتكنولوجيا
بنهاية هذا المستوى، ستكون قادرًا على: تحديد أنواع سمات البيانات المختلفة وأنواع مجموعات البيانات المختلفة، وفهم الاختلافات بين مشاكل جودة البيانات المختلفة بما في ذلك الضوضاء والقيم المفقودة والتكرارات.
وصف تقنيات إعداد البيانات المختلفة بما في ذلك أخذ العينات واختيار الميزات والتقدير وتحويل المتغيرات.
الحصول على فكرة ملموسة حول تطور البيانات الضخمة وهيكلية نظام Hadoop البيئي، وتنفيذ مشروعات باستخدام Python تغطي جوانب مختلفة من المستوى.
دروس مجانية
أنواع البيانات ومشاكل الجودة
البيانات 1
البيانات 2
السِمات
1. الحصول على البيانات ومعالجتها
أنواع البيانات ومشاكل الجودة
البيانات 1
البيانات 2
السِمات
أنواع السِمات 1
أنواع السِمات 2
أنواع السِمات 3
أنواع مجموعات البيانات
البيانات المستندة إلى رسوم بيانية
جودة البيانات
البيانات المفقودة
البيانات المكررة
ملخص ما سبق
تحضير البيانات
أخذ العينات
اختيار الميزة
طرق اختيار الميزة
التحويل إلى قيم منفصلة 1
التحويل إلى قيم منفصلة 2
تحويل المتغيرات
مثال على تحويل المتغيرات
المشروع المطلوب
التعمق في البيانات الضخمة
النظم الموزعة
تطور البيانات الضخمة 1
تطور البيانات الضخمة 2
تحديات البيانات الضخمة
نظام Hadoop البيئي 1
نظام Hadoop البيئي 2
الحصول على البيانات ومسار التحليل
أسئلة
يقدم هذا المستوى وصفًا شاملاً لسمات البيانات المختلفة وأنواع مجموعات البيانات التي قد يواجهها عالم البيانات عادةً. يصف المستوى أيضًا مشكلات جودة البيانات المختلفة وكيفية التعامل معها. يتم أيضًا تغطية تقنيات إعداد البيانات المختلفة. أخيرًا، يتم إعطاء مقدمة للبيانات الضخمة ونظام Hadoop البيئي.
التخرج في أي جامعة (كلية الهندسة غير أساسية)
الخبرة السابقة في البرمجة لأي لغة تعد إضافة كبيرة
الدراية بالجبر الخطي إضافة كبيرة
عضو في معهد مهندسي الكهرباء والإلكترونيات
3,130 متعلمين
5 دورات