#المختصرالمفيدمنعلمالبيانات
تحت هذي التغريدة بنتكلم عن جزء بسيط عن :
البيانات الضخمة Big Data
تحليل البيانات Data Analysis
علوم البيانات Data Science
التنقيب في البيانات Data mining
البيانات المفتوحة Open Data
البيانات الوصفية Metadata
كثرة المسميات ولابد ان نفرق بينهم ?
البيانات الضخمة Big Data
هي مجموعة من البيانات التي هي بحجم يفوق قدرة معالجتها بإستخدام قواعد البيانت التقليدية من تخزين وادارة وتحليل في فترة زمنية مقبولة
هذي البيانات ليست مخزنة على سيرفر واحد بل على عشرات بل مئات الآلاف من السيرفرات اللي كلها بتساهم في بناء نظام ال Big Data
من أشهر أنظمة ال Big Data هي مجموعة تقنيات Apache Hadoop و هدوب Hadoop هي مظلة لمجموعة كبيرة جداً من التقنيات اللي كل حاجة فيها بتعمل وظيفة معينة مثال:
أول تقنية و هي HDFS وهذا اسم ال File System تبع Hadoop و اللي يعتبر القاعدة الأساسية اللي بتني عليها كل التقنيات التانية
وهذا اللي بيسمح بتخزين البيانات و الحفاظ عليها عن طريق ال Redundancy و يعطيك abstraction بحيث ما تحتاج تعرف تفاصيل كثير عن البيانات و فين متخزنة
وبعد كذا تحتاج برامج تشتغل على البيانات وهذا بنسميه Programming Model يمكن اشهرهم على الاطلاق هو MapReduce
وهناك ادوات اخرى كثير
تحليل البيانات Data Analysis
هو شخص يتعامل مع البيانات بشكل يومي و غالباً من خلال ادوات جاهزة, مثل Tableu أو حتى Excel, الفكرة انه أغلب الوقت بيكون هدفه هو الوضع الحالي أكثر من المستقبل,مثل حجم المبيعات اليوم, أو كم عميل جديد, أو مقارنة السنة هذي بالسنة اللي فاتت في عدة جهات