ما هي البيانات الضخمة؟

بدأ مصطلح "البيانات الضخمة" أو "البيانات الضخمة" يكتسب شعبية منذ عام 2011. اليوم سمعه الجميع مرة واحدة على الأقل. المشكلة هي أنه في كثير من الأحيان لا يتم استخدام المفهوم من قبل التعريف. لذلك ، دعونا نفهم بالتفصيل ما هو عليه.

صورة

مع تطور التكنولوجيا ، بدأت كمية البيانات في الزيادة بشكل كبير. لم تعد الأدوات التقليدية تغطي الحاجة إلى معالجة المعلومات وتخزينها. لمعالجة البيانات التي يتجاوز حجمها مئات تيرابايت وتتزايد باستمرار ، تم إنشاء خوارزميات خاصة. يطلق عليها "البيانات الضخمة".

اليوم ، يتم جمع المعلومات بأحجام كبيرة من مصادر مختلفة: الإنترنت ، ومراكز الاتصال ، والأجهزة المحمولة ، وما إلى ذلك. في معظم الأحيان ، لا تحتوي هذه البيانات على بنية وترتيب واضح ، لذلك لا يمكن لأي شخص استخدامها في أي نشاط. لأتمتة التحليل ، يتم استخدام تقنيات "البيانات الضخمة".

متى ظهرت أول البيانات الضخمة؟


ظهرت البيانات الضخمة في 60-70s من القرن الماضي جنبا إلى جنب مع مراكز البيانات الأولى (مراكز البيانات). في عام 2005 ، بدأت الشركات في فهم مدى المحتوى الذي أنشأه مستخدمو خدمات الإنترنت (Facebook ، YouTube ، إلخ). في الوقت نفسه ، بدأت أول منصة مصممة للتفاعل مع مجموعات البيانات الكبيرة ، Hadoop ، بالعمل. اليوم هي مجموعة كبيرة من التقنيات لمعالجة المعلومات. بعد ذلك بقليل ، بدأت NoSQL في اكتساب شعبية - مجموعة من الأساليب لإنشاء أنظمة إدارة بيانات كبيرة.

بدأ مقدار المعلومات التي تم إنشاؤها في الزيادة مع ظهور خدمات الإنترنت الكبيرة. يقوم المستخدمون بتحميل الصور وتصفح المحتوى وما إلى ذلك. يتم جمع كل هذه المعلومات بأحجام كبيرة لمزيد من التحليل ، وبعد ذلك يمكنك إجراء تحسينات على الخدمات. على سبيل المثال ، تستخدم الشبكات الاجتماعية البيانات الضخمة لعرض الإعلانات ذات الصلة للمستخدمين (أي تلك التي تتوافق مع احتياجاتهم واهتماماتهم) في هدف. يتيح ذلك للشبكات الاجتماعية بيع الأنشطة التجارية الفرصة لإجراء حملات إعلانية دقيقة.

الميزات الرئيسية للبيانات الضخمة


في بداية المقال ، حددنا ثلاثة خصائص رئيسية للبيانات الضخمة من تعريف مقبول بشكل عام. دعونا نفتحها بمزيد من التفصيل:

  • . « » , . : , — . « » .
  • . . «big data». .
  • . , . — .

على مدى السنوات القليلة الماضية ، ازدادت شعبية البيانات الضخمة ، ونتيجة لذلك حصلوا على خاصيتين (خصائص) إضافية: القيمة والموثوقية. يتم تحديد القيمة من قبل كل شركة بطريقتها الخاصة. يقوم الخبراء بتقييم ما إذا كانت المعلومات الواردة ستفيد العمل. وتبين الموثوقية ما إذا كانت البيانات المستخدمة يمكن الوثوق بها (مدى صحتها) ، لأن المعلومات غير الدقيقة يمكن أن تضر بالشركة وأنشطتها.

كيف يعملون معهم؟


تحمل البيانات الضخمة الكثير من المعلومات المفيدة ، والتي على أساسها تخلق الشركات فرصًا جديدة وتشكل نماذج أعمال. ينقسم العمل باستخدام البيانات الضخمة إلى 3 مراحل: التكامل والإدارة والتحليل.

المرحلة 1. التكامل

في هذه المرحلة ، تدمج الشركة التقنيات والأنظمة في عملها الذي يسمح لها بجمع كميات كبيرة من المعلومات من مصادر مختلفة. يتم إدخال آليات معالجة البيانات وتنسيقها لتبسيط عمل المحللين باستخدام "البيانات الضخمة".

2 المرحلة. مراقبة

يجب تخزين البيانات المستلمة في مكان ما ، ويتم حل هذه المشكلة قبل التعامل معها. يتم اتخاذ القرار على أساس العديد من المعايير ، وأهمها التفضيلات في الشكل وتقنية المعالجة. كقاعدة ، تستخدم الشركات التخزين المحلي أو الخدمات السحابية العامة أو الخاصة للتخزين.

3 المرحلة. التحليل

تبدأ البيانات الضخمة في الاستفادة بعد التحليل. هذه هي المرحلة النهائية من التفاعل معهم. لهذا ، يتم استخدام التعلم الآلي ، ورابطة قواعد التعلم والخوارزميات الجينية وغيرها من التقنيات. بعد تحليل البيانات ، يبقى فقط الأكثر قيمة للأعمال.

أمثلة على البيانات الضخمة


بشكل عام ، مع فرز "البيانات الضخمة". ولكن يبقى السؤال المهم - أين يمكن تطبيقها عمليا؟ الجواب: في أي مجال نشاط يعمل بالبيانات اللازمة للتحليل. دعونا نلقي نظرة على بعض الأمثلة الواقعية. سيساعدك هذا على فهم سبب الحاجة إلى البيانات الضخمة بشكل أفضل وكيف يمكنك الاستفادة منها.

البيانات الضخمة في البنوك

في القطاع المصرفي الروسي ، كان سبيربنك أول من استخدم البيانات الضخمة. على أساس "البيانات الضخمة" ونظام المقاييس الحيوية ، في عام 2014 طوروا نظامًا لتحديد هوية العميل بالصورة. مبدأ التشغيل بسيط للغاية: مقارنة الصورة الحالية بصورة من قاعدة البيانات التي يلتقطها الموظفون عند إصدار بطاقة مصرفية. قلل النظام الجديد من حالات الاحتيال 10 مرات.

اليوم ، يواصل بنك Sberbank استخدام البيانات الضخمة في عمله: يتيح لك جمع المعلومات وتحليلها إدارة المخاطر ومكافحة الاحتيال وتقييم الجدارة الائتمانية للعملاء وإدارة قوائم الانتظار في الفروع وغير ذلك الكثير.

مثال آخر من القطاع المصرفي الروسي هو VTB24. بدأت الشركة في تنفيذ "البيانات الضخمة" بعد فترة وجيزة من بنك سبيربنك. اليوم ، يستخدمون البيانات الضخمة لتقسيم تدفقات العملاء وإدارتها ، وإنشاء بيانات مالية ، وتحليل المراجعات على الإنترنت ، وأكثر من ذلك بكثير.

تساعد Alfa-Bank Big Data في مراقبة صورة العلامة التجارية على الإنترنت ، وتقييم الجدارة الائتمانية للعملاء الجدد ، وتخصيص المحتوى ، وإدارة المخاطر ، وما إلى ذلك.

البيانات الضخمة في الأعمال

يعتقد الكثير من الناس عن طريق الخطأ أن العمل مع البيانات الضخمة لا يكون ملائمًا إلا للقطاع المصرفي وشركات تكنولوجيا المعلومات. هذا يدحض مثال أعمال الحديد والصلب Magnitogorsk ، التي طورت خدمة Sniper لتقليل تكاليف المواد الخام في الإنتاج. تجمع التكنولوجيا كميات كبيرة من المعلومات وتحللها وتقدم توصيات لتحسين تكاليف المواد.

يستخدم Surgutneftegas نظامًا خاصًا لتتبع العمليات التجارية الرئيسية في الوقت الفعلي. وهذا يساعد في أتمتة محاسبة المنتجات ، والتسعير ، وتزويد الموظفين بالبيانات الصحيحة ، إلخ.

البيانات الضخمة في التسويق

يستخدم المسوقون بيانات كبيرة للتنبؤ بنتائج الحملات الإعلانية. يساعد التحليل أيضًا في تحديد الجمهور الأكثر اهتمامًا. أحد الأمثلة البارزة على "البيانات الضخمة" في التسويق هو Google Trends. يتلقى النظام كمية كبيرة من البيانات ، وبعد التحليل ، يمكن للمستخدم تقييم موسمية المنتج (العمل ، الخدمة).

صعوبة الاستخدام


حيث توجد فرص كبيرة ، هناك صعوبات كبيرة تنتظر هناك. هذه القاعدة لم تتجاوز البيانات الضخمة.

الصعوبة الأولى التي تواجهها الشركات هي أن البيانات الضخمة تشغل مساحة كبيرة. نعم ، تقنيات التخزين تتحسن باستمرار ، ولكن في نفس الوقت ، تنمو كمية البيانات بشكل مطرد (في المتوسط ​​، مرتين كل عامين).

إن اقتناء مساحة تخزين ضخمة لا يحل جميع المشاكل. لن يكون هناك أي معنى من تخزين البيانات البسيط ، فأنت بحاجة للعمل معهم للحصول على الفوائد. من هنا تنشأ تعقيدات أخرى - ترتيب معالجة البيانات الضخمة المستلمة.

يقضي المحللون الآن 50-80٪ من وقت العمل لإدخال المعلومات في شكل مقبول للعميل. يتعين على الشركات توظيف المزيد من المهنيين ، مما يزيد من التكاليف.

ومشكلة أخرى هي التطور السريع للبيانات الضخمة. تظهر أدوات وخدمات جديدة للعمل بانتظام (على سبيل المثال ، Hbase). يجب على الشركات أن تنفق الكثير من الوقت والمال من أجل "أن تكون في الاتجاه" وليس متخلفة عن التنمية.

وبالتالي ، فإن البيانات الضخمة هي مزيج من التقنيات لمعالجة كميات كبيرة من المعلومات (مئات تيرابايت وأكثر) واليوم ينكر عدد قليل من الناس أهميتها في المستقبل. ستزداد شعبيتها وسيزداد التوزيع في الأعمال. في وقت لاحق ، سيطورون تقنيات لأتمتة التحليل ، ولن تعمل الشركات الكبيرة فحسب ، بل ستعمل أيضًا الشركات المتوسطة والصغيرة مع البيانات الضخمة.

هل تريد معرفة كيفية العمل مع البيانات الضخمة وتوسيع معرفتك في التحليلات؟ قم بالتسجيل في دورة محلل البيانات الكبيرة عبر الإنترنت. اكتشف التفاصيل!


All Articles