بحيرة بيانات محددة
يحتوي بحيرة البيانات يحتوي على كمية عدد ضخم من البيانات الأولية غير المنظمة بتنسيق خام.
لذلك ، كل ما تحتاجه هو جهاز يدعم نظام ملفات ثابت ، مما يعني أنه يمكنك استعمال الحاسوب المركزي حسب الحاجة. يتم نقل البيانات لـ خوادم أخرى للمعالجة.
تستخدم معظم الشركات نظام ملفات Hadoop (HDFS)) ، لأنه مصمم للمعالجة السريعة لمجموعات البيانات الكبيرة ، ويستخدم في بيئة بيانات واسعة حيث يمكن استعمال بحيرات البيانات.
يوفر هذا الدعم لبيانات التنسيق الأصلي فائدة واسعة ، أي إذا كنت أرغب في الحصول على الكثير من البيانات ومعرفة طريقة التعامل معها في الحاضر ، فهذا يتماشى مع شعار ما تفعله Data Lake الآن.
تأخذ بحيرة البيانات كل الأشياء التي قد تكون مثيرة للاهتمام أو غبية أو حتى غير مفهومة ، ولا يمكننا تخمين ذات قيمة هذه البيانات ومعرفة أهميتها اليوم ، ولكنها قد تكون مهمة جدًا في الحاضر.
هذا يعني أنه إذا لم تكن متأكدًا من وقت استعمال البيانات ، ولا يهم ما إذا كان لديك وصول ثانوي وترغب في تخزينه في نموذج منخفض التكلفة ، فإن بحيرة البيانات هي الحل الأفضل ، وعادةً ما تكون يتماشى مع الشعار. بدون جمع البيانات ، لن تحصل عليها مرة ثانية أبدًا.
-
بحيرة البيانات ومستودع البيانات
قاعدة البيانات إنه ليس بالأمر الجديد ، حيث توجد مستودعات البيانات منذ عقود ، وعلى الرغم من أنه من الطبيعي مقارنة مستودعات البيانات ببحيرات البيانات ، فإن الاختلاف الأساسي الذي يميز مستودعات البيانات عن بحيرات البيانات هو من نوع البيانات المخزنة لـ طريقة المعالجة.
أحد الاختلافات الرئيسية بين بحيرة البيانات مستودع البيانات هو أن بحيرة البيانات لا تتطلب أجهزة أو برامج خاصة مثل مستودع البيانات.