المختصرالمفيدمنعلمالبيانات تحت هذي التغريدة بنتكلم عن جزء بسيط عن : البيانات الضخمة Big Data تح

#المختصر_المفيد_من_علم_البيانات تحت هذي التغريدة بنتكلم عن جزء بسيط عن : البيانات الضخمة Big Data تحليل البيانات Data Analysis علوم البيانات Data Scie

#المختصرالمفيدمنعلمالبيانات

تحت هذي التغريدة بنتكلم عن جزء بسيط عن :

البيانات الضخمة Big Data

تحليل البيانات Data Analysis

علوم البيانات Data Science

التنقيب في البيانات Data mining

البيانات المفتوحة Open Data

البيانات الوصفية Metadata

كثرة المسميات ولابد ان نفرق بينهم ?

البيانات الضخمة Big Data

هي مجموعة من البيانات التي هي بحجم يفوق قدرة معالجتها بإستخدام قواعد البيانت التقليدية من تخزين وادارة وتحليل في فترة زمنية مقبولة

هذي البيانات ليست مخزنة على سيرفر واحد بل على عشرات بل مئات الآلاف من السيرفرات اللي كلها بتساهم في بناء نظام ال Big Data

من أشهر أنظمة ال Big Data هي مجموعة تقنيات Apache Hadoop و هدوب Hadoop هي مظلة لمجموعة كبيرة جداً من التقنيات اللي كل حاجة فيها بتعمل وظيفة معينة مثال:

أول تقنية و هي HDFS وهذا اسم ال File System تبع Hadoop و اللي يعتبر القاعدة الأساسية اللي بتني عليها كل التقنيات التانية

وهذا اللي بيسمح بتخزين البيانات و الحفاظ عليها عن طريق ال Redundancy و يعطيك abstraction بحيث ما تحتاج تعرف تفاصيل كثير عن البيانات و فين متخزنة

وبعد كذا تحتاج برامج تشتغل على البيانات وهذا بنسميه Programming Model يمكن اشهرهم على الاطلاق هو MapReduce

وهناك ادوات اخرى كثير

تحليل البيانات Data Analysis

هو شخص يتعامل مع البيانات بشكل يومي و غالباً من خلال ادوات جاهزة, مثل Tableu أو حتى Excel, الفكرة انه أغلب الوقت بيكون هدفه هو الوضع الحالي أكثر من المستقبل,مثل حجم المبيعات اليوم, أو كم عميل جديد, أو مقارنة السنة هذي بالسنة اللي فاتت في عدة جهات


هادية الصمدي

13 Blog bài viết

Bình luận