ما هي بحيرة البيانات؟

عبارة عن مخزن مركزي يسمح للمستخدم بتخزين كافة أنواع البيانات المهيكلة وغير المهيكلة بكميات كبيرة جداً وبصيغتها الأصلية لاستخدامها مستقبلاً عند الحاجة إليها. تعطى البيانات المخزنة في بحيرة البيانات محددات وبيانات وصفية ووسوم لسهولة استرجاعها. ويمكن تطبيق مختلف أنواع التحليل عليها؛ بدءاً من التمثيل المرئي وصولاً إلى معالجة البيانات الضخمة والتحليل في الزمن الحقيقي والتعلم الآلي، وذلك للمساعدة في اتخاذ قرارات أفضل.

ما الفرق بين بحيرة البيانات ومستودع البيانات؟

تختلف بحيرة البيانات عن مستودع البيانات (Data Warehouse) في العديد من الجوانب، فمستودع البيانات عبارة عن قاعدة بيانات معززة لتحليل البيانات العلائقية القادمة من أنظمة المعاملات وتطبيقات الأعمال، وتُخزن فيه البيانات المهيكلة فقط ضمن ملفات ومجلدات بالاعتماد على بنية هرمية، وتستخدم من قبل محللي الأعمال؛ حيث يكون الهدف من تخزين تلك البيانات محدد مسبقاً.

أما بحيرة البيانات تُخزن البيانات العلائقية القادمة من تطبيقات الأعمال وغير العلائقية القادمة من تطبيقات الهواتف وأجهزة إنترنت الأشياء ومواقع الويب وشبكات التواصل الاجتماعي وغيرها بالاعتماد على بنية مسطحة، وتُستخدم من قبل علماء البيانات والمطورين ومحللي الأعمال فالهدف من تخزين البيانات فيها غير محدد مسبقاً.

ما أهم فوائدها؟

تقدم فوائد عديدة أهمها:

  1. السماح للمطورين وعلماء البيانات بالوصول إلى البيانات وتحضيرها وتحليلها بشكل أسهل وأسرع بفضل مرونتها العالية.
  2. سهولة الوصول إليها من قبل مجموعة أكبر من المستخدمين.
  3. انخفاض تكلفة تنفيذها لأن معظم التقنيات المستخدمة لإدارتها مفتوحة المصدر مثل هادوب.
  4. قابلية التوسع نظراً لعدم وجود بنية محددة لها.