أساطير البيانات الضخمة والثقافة الرقمية



نواصل نشر التقارير الأكثر إثارة للاهتمام من RAIF ، المنتدى السنوي للذكاء الاصطناعي الذي تنظمه Jet Infosystems. اليوم نريد مشاركة قصة بوريس أسينوفيتش نوفيكوف ، دكتور في العلوم الفيزيائية والرياضية ، أستاذ في قسم علوم الكمبيوتر HSE.

أساطير البيانات الضخمة والثقافة الرقمية


تشير الكلمة الكبيرة في حالتنا إلى الأساطير أكثر منها إلى البيانات ، لذلك سأخبر بشكل أساسي عن الأولى ، ولكن في سياق الأخيرة. منذ أن كنت أتظاهر بالعمل في المجتمع العلمي لعدة عقود ، سأبدأ بتعريفه ليبدو وكأنه معرفة دقيقة.


الأساطير جزء لا يتجزأ من ثقافة المجتمع ، فقد كانت موجودة دائمًا ولا تزال تظهر في العالم الحديث. أعطي أمثلة:


يجب أن يتذكر الجزء الأكبر من الجمهور الضوضاء حول عام 2000 ، والتي هي في الواقع واحدة من 400 طريقة صادقة نسبيًا لاستخراج الأموال من العميل ، ولا شيء أكثر من ذلك. بالطبع ، لم تحدث الكارثة في ذلك الوقت.

تنشأ الكثير من الخرافات حول هندسة البرمجيات - هناك العديد من وجهات النظر المختلفة ، ولن أركز على هذا الموضوع الآن.

كانت هذه المبادرة مدفوعة بمبادرة من الأعلى: في الجامعة التي كنت أعمل فيها ، كانت هناك حاجة إلى تعليم القراءة والكتابة الرقمية للجميع ، من رياض الأطفال إلى المدرسة العليا. لم يكن أحد يعرف ما هو هذا الأمر ، وقد اعترفت بحماسة للإدارة بأنني فهمت تقريبًا كيفية القيام بذلك ... وتم الإمساك بي. كان من الضروري تعلم تخصصات مختلفة في برنامج واحد:


كانت مساهمتي الرئيسية في هذه المسألة هي أنني قمت بإعادة تسمية هذه الدورة من محو الأمية الرقمية إلى الثقافة الرقمية.

في أحد المؤتمرات الدولية ، سمعت هذا البيان: من أجل جذب انتباه الجمهور ، تحتاج إلى إضافة بعض التلميحات الجنسية على الأقل إلى التقرير ، وهكذا: قبل بضع سنوات في الصحافة (على وجه الخصوص ، في روسيا) نوقشت القضية على نطاق واسع بدأت تلميذة أمريكية بإرسال إعلانات للنساء الحوامل (ينتهي السياق الجنسي للقصة هنا) ، ثم رفعت الأسرة دعوى قضائية ، ولكن في النهاية كان يجب سحب الدعوى ... لأن الفتاة اتضح أنها حامل بالفعل. يقولون ، لقد أحدث التاريخ الكثير من الضجيج ، هؤلاء المحللون يعرفون عنا أكثر من أنفسنا (هذا غير مرجح)! كل هذا خطير للغاية ، ومن الضروري تقوية الدفاع. لذلك ولدت الأساطير:

  1. البيانات الضخمة خطيرة للغاية
  2. إنهم يعرفون عنا أكثر من أنفسنا.
  3. مطلوب تدابير أمنية إضافية

لا تفهموني خطأ: الأمان مهم ، لكن دعنا نرى كيفية تقييم هذه الحالة بشكل احترافي.


ما الاستنتاج الذي يمكن التوصل إليه؟ يمكن أن ينتج عن التحليل بعض النتائج الصحيحة ، ويمكننا أيضًا أن نقول أننا لا نعرف شيئًا في بعض الأحيان.

يلفت أصدقائي وزملائي الانتباه إلى حقيقة أن البريد العشوائي يعطي في بعض الأحيان النتائج الصحيحة ، ولا يمكننا قول أي شيء عن جودة البريد إذا لم نقم بتقييم أي مؤشرات كمية. بادئ ذي بدء ، من الضروري تقييم الاكتمال والدقة.

الأنواع التالية من الأساطير التي استعرتها من سياق خارجي. على سبيل المثال ، في أحد أهم مؤتمرات SIGMOD 2019 لمعالجة البيانات ، كانت هناك حلقة نقاش (أو ، كما نقول ، مائدة مستديرة) حول موضوع "علوم البيانات المسؤولة". ناقشوا أمثلة لكيفية الاستخدام غير المسؤول لأدوات تحليل البيانات ، والتعلم الآلي ، وما إلى ذلك. كأحد الأمثلة ، استشهدنا بقصة تحديد جنس الشخص من صور العيون. عمل الناس على هذا لعدة سنوات ، وحققوا دقة تصل إلى 80 ٪ ، حتى اكتشف أحد المتشككين أنهم في الواقع يحددون وجود أو عدم وجود مستحضرات التجميل.

هذا فضول ، ولكن هنا مثال يكون فيه الخطر حقيقيًا تمامًا: نحن نتحدث عن استخدام طرق التعلم الآلي لتحديد المجرمين من الصور الفوتوغرافية. كما اتضح ، في مبدأ عمل نظام التعلم هذا ، هناك مشاكل تتعلق بالصحة السياسية: أولاً ، قدموا إجابات إيجابية كاذبة بترددات مختلفة اعتمادًا على العرق ، وثانيًا ، كما اتضح لاحقًا ، في الواقع ، قرروا وجود أو عدم وجود ابتسامة على الصور ، لا أكثر. ومع ذلك ، كانت هناك محاولات لاستخدام هذا النظام ، وكان من المفترض أن يقوم الضباط الذين كان من المفترض أن يستخدموا النتائج ، في حالة الخلاف ، بكتابة تفسير مكتوب لسبب عدم موافقتهم على النتائج التي ينتجها النظام. هذا مثال على كيف يمكن أن تصبح الأساطير خطرة على المجتمع.


لسبب ما نتحدث عن علم البيانات ، على الرغم من أننا نتحدث عن التطبيقات الصناعية. في جميع المجالات الأخرى - علوم الكمبيوتر ، ولكن ... هندسة البرمجيات. معادلات الفيزياء الرياضية ونوع من بناء الجسور ، أو أي شيء آخر؟ زملائي العلماء لا يمكن الوثوق بهم! أود أن أعتقد أن علوم البيانات تنتمي إلى قسم "العلوم" ، ولسوء الحظ ، فإن صياغة هندسة البيانات قد تم تناولها بالفعل من خلال مفهوم آخر.

أعود إلى القصة بتصميم الدورة الدراسية للجامعة بأكملها ، بغض النظر عن الاستعداد والتخصص. تظهر الصورة على الجانب الأيمن (البجعة والسرطان والرمح) كيف عمل الفريق من ممثلين عن جميع أقسام الجامعة.


ومع ذلك ، حاولنا القيام بشيء معقول. كانت الفكرة هي إظهار أشياء بسيطة يمكن لكل باحث أن يفعلها لنفسه ، بغض النظر عن المجال الذي يعمل فيه. علاوة على ذلك ، حتى يتمكن من فهم أي نقطة (هذا هو الأهم!) ، تحتاج إلى الاتصال بمتخصصي معالجة البيانات. حاولت أن أتجنب هذه الوصفات للمبتدئين (لكن القليل منها) ، مثل "اجعل الإضافة دليلاً شائعًا ، ولكن ليس عمليًا".

لذا ، الأساطير حتمية ، ويجب أن نفهم أنه لا يزال يتعين علينا التعامل معها. الأساطير هي مصدر العديد من الأخطاء والفشل والمشكلات ، وقد تكون خطيرة في بعض الأحيان - يمكن أن يكون للاستخدام غير المدروس "للمعرفة" الأسطورية عواقب سلبية.

بالإضافة إلى حقيقة أننا نطور تقنيات ، من الضروري تثقيف المجتمع ، وهذا مصدر قلق دائم لن يتم حله بالكامل أبدًا ، لأن البشرية بشكل عام لا تتطور بالسرعة التي تتطور بها التكنولوجيا. من الصعب جدًا تثقيف الناس من الذكاء الاصطناعي - أحد مصادر الأساطير. نحن بحاجة إلى معرفة كيفية العمل والعيش معه بطريقة تتجنب الأخطار الكبيرة.

All Articles