ما هو الهادوب و كيفية عمله:
ال Hadoop
ليس قاعدة بيانات، بل إطار عمل برمجي مفتوح المصدر يستند إلى Java بنسبة 100٪، وهو يدعم معالجة مجموعات البيانات الضخمة في بيئة المعلوماتية الموزعة، وهو نظام فعال أثبت جدارته من حيث التكلفة، وقابلية التوسع، والمعالجة المتوازية للبيانات الموزعة https://t.co/CSSPtyr8uS
وإدارة تجاوز الأخطاء تلقائيًّا ودعم مجموعات كبيرة من العقد، ومن أشهر مستعملي الهادوب:
Amazon, Akamai, Apple, AVG, eBay, Electronic Arts, Facebook, Google, IBM, ImageShack, LinkedIn, Microsoft, The New York Times, Twitter, Yahoo.
يشبه Hadoop نواة نظام التشغيل وتتألف أطر عمله من مكونين أساسيين هما
HDFS (Hadoop Distributed File Systems)
وإطار
MapReduce
المكتوبة بلغات مختلفة: Java و Ruby و Python و ++C.
أما برامج MapReduce فهي متوازية في طبيعتها، ومن ثَم فهي مفيدة جدًّا لإجراء تحليل للبيانات على نطاق واسع باستعمال أجهزة متعددة في المنظومة.
يقوم Hadoop بتكرار كل جزء من البيانات على الأجهزة الأخرى الموجودة داخل المنظومة ويعتمد عدد النسخ التي يتم نسخها على عامل النسخ المتماثل.
تمر العملية برمتها بأربع مراحل من التنفيذ:
- التقسيم
ينقسم الإدخال في MapReduce إلى أجزاء ذات حجم ثابت تسمى تجزئة الإدخال.
- رسم الخرائط
تمرَّر فيها البيانات بكل تقسيم إلى وظيفة التعيين لإنتاج قيم الإخراج. https://t.co/0qoZEkQGbR