هيكلة المخاطر والقرارات عند استخدام BigData للإحصاءات الرسمية

مقدمة المترجم اهتمتني

المادة ، ويرجع ذلك أساسًا إلى الجدول أدناه:



نظرًا لأن الإحصائيات (والروسية ، على المستوى الجيني) ، بعبارة ملطفة ، لا تحب كل شيء يختلف عن الاعتماد الخطي ، تمكن هؤلاء الرجال من السحب من خلال استخدام وظيفة التنشيط في شكل مكافئ لتحديد درجة خطر استخدام BigData في الإحصاءات الرسمية. أحسنت. بطبيعة الحال ، أضاف الإحصائيون ملاحظاتهم إلى هذا العمل - "1 إن أي أخطاء أو سهو هي مسؤولية المؤلفين وحدهم. الآراء الواردة في هذه الوثيقة شخصية ولا تعكس بالضرورة الموقف الرسمي للمفوضية الأوروبية ". لكن تم نشر العمل. أعتقد أن هذا يكفي اليوم ، وأنهم (المؤلفون) لم يمنعوا أي شخص من العثور على مقاييسه في هذه الجوانب.

يمكن تنظيم العمل إلى حد ما لفصل أين وكيف تختلف الأساليب الإحصائية عن طرق البحث لـ BigData. في رأيي ، فإن أكبر فائدة من هذا العمل ستكون عند التحدث مع العميل ودحض تصريحاته مثل:

- ونحن نجمع الإحصائيات بأنفسنا ، ما الذي لا تزال تريد البحث عنه؟
- وتقدم لنا نتائجك حتى ننسقها مع إحصاءاتنا. في هذا السؤال ، يقول المؤلفون أنه سيكون من اللطيف قراءة هذا العمل (3 ما حجم البيانات الضخمة؟ استكشاف دور البيانات الضخمة في الإحصاءات الرسمية )

في هذه الورقة ، وضع المؤلفون رؤيتهم لمستوى المخاطر. هذه المعلمة بين قوسين ، ولا يجب الخلط بينها وبين الإشارة إلى المصادر.

الملاحظة الثانية. يستخدم المؤلفون مصطلح BDS - هذا تناظري لمفهوم BigData. (يبدو مقتطفًا للإحصاءات الرسمية).

مقدمة

يستكشف عدد متزايد من المكاتب الإحصائية إمكانية استخدام مصادر بيانات كبيرة لإنتاج إحصاءات رسمية. حاليا ، لا يوجد سوى عدد قليل من الأمثلة حيث تم دمج هذه المصادر بشكل كامل في الإنتاج الإحصائي الفعلي. وبالتالي ، فإن المدى الكامل للعواقب الناجمة عن اندماجهم غير معروف حتى الآن. وفي الوقت نفسه ، جرت المحاولات الأولى لتحليل ظروف وتأثير البيانات الضخمة على مختلف جوانب الإنتاج الإحصائي ، مثل الجودة أو المنهجية. في الآونة الأخيرة ، طورت فرقة العمل إطارًا عالي الجودة لإنتاج إحصاءات البيانات الضخمة في سياق مشروع البيانات الضخمة للجنة الاقتصادية لأوروبا التابعة للأمم المتحدة.ووفقًا لمدونة الممارسات الإحصائية الأوروبية ، فإن توفير معلومات إحصائية عالية الجودة هي المهمة الرئيسية للمكاتب الإحصائية. نظرًا لأن الخطر يُعرَّف بأنه تأثير عدم اليقين على الأهداف (على سبيل المثال ، منظمة التقييس الدولية ISO 31000) ، وجدنا أنه من المناسب تصنيف المخاطر وفقًا لقياسات الجودة التي تؤثر عليها.
يوفر هيكل الجودة المقترح للبيانات الإحصائية التي تم الحصول عليها من مصادر البيانات الكبيرة فكرة منظمة عن الجودة المرتبطة بجميع مراحل عملية الأعمال الإحصائية ، وبالتالي يمكن أن تكون بمثابة أساس لتقييم شامل وإدارة المخاطر المرتبطة بمصادر البيانات الجديدة هذه. يقدم أبعادًا نوعية جديدة خاصة بـ K أو (ذات أهمية عالية عند) استخدام البيانات الضخمة للإحصاءات الرسمية ، مثل البيئة المؤسسية / التجارية أو التعقيد. باستخدام هذه القياسات النوعية الجديدة ، من الممكن تحديد المخاطر المرتبطة باستخدام مصادر البيانات الكبيرة في الإحصاءات الرسمية بشكل أكثر منهجية.

في هذه الورقة ، نسعى إلى تحديد المخاطر التي يسببها استخدام البيانات الضخمة في سياق الإحصاءات الرسمية. نتخذ نهجًا منهجيًا لتحديد المخاطر في سياق هيكل الجودة المقترح. من خلال التركيز على قياسات الجودة المقترحة حديثًا ، يمكننا وصف المخاطر غير الموجودة حاليًا أو التي لا تؤثر على إنتاج الإحصاءات الرسمية. في الوقت نفسه ، يمكننا تحديد المخاطر الحالية ، والتي سيتم تقييمها بطرق مختلفة تمامًا عند استخدام البيانات الضخمة للحصول على إحصائيات. ثم ننتقل إلى دورة إدارة المخاطر ونقدم تقييمًا لاحتمالية وتأثير هذه المخاطر. نظرًا لأن تقييم المخاطر ينطوي على الذاتية في إسنادها ، والاحتمال والأثر على المخاطر المختلفة ، فإننا نقيس الاتفاق بين العشرات من أصحاب المصلحة المختلفين ،قدمت بشكل مستقل. ثم نقدم خيارات للتخفيف من هذه المخاطر في أربع فئات رئيسية: التجنب ، والحد ، والمشاركة ، والاحتفاظ. وفقًا لـ ISO ، يجب أن يكون أحد مبادئ إدارة المخاطر خلق القيمة ، أي أن الموارد للحد من المخاطر يجب أن تكون أقل من عدم العمل. وفقًا لهذا المبدأ ، سنقوم أخيرًا بتقييم التأثير المحتمل لبعض إجراءات تخفيف المخاطر على جودة النتائج النهائية من أجل الوصول إلى تقييم أكثر شمولاً لاستخدام البيانات الضخمة للإحصاءات الرسمية.يجب أن يكون من مبادئ إدارة المخاطر خلق القيمة ، أي أن الموارد للحد من المخاطر يجب أن تكون أقل من عدم العمل. وفقًا لهذا المبدأ ، سنقوم أخيرًا بتقييم التأثير المحتمل لبعض إجراءات تخفيف المخاطر على جودة النتائج النهائية من أجل الوصول إلى تقييم أكثر شمولاً لاستخدام البيانات الضخمة للإحصاءات الرسمية.يجب أن يكون من مبادئ إدارة المخاطر خلق القيمة ، أي أن الموارد للحد من المخاطر يجب أن تكون أقل من عدم العمل. وفقًا لهذا المبدأ ، سنقوم أخيرًا بتقييم التأثير المحتمل لبعض إجراءات تخفيف المخاطر على جودة النتائج النهائية من أجل الوصول إلى تقييم أكثر شمولاً لاستخدام البيانات الضخمة للإحصاءات الرسمية.

1 المقدمة


1.1. خلفية


تميز تطوير "البيانات الضخمة" بقلم كينيث نيل كوكير وفيكتور ماير شوينبرجر في مقالتهما "تزايد البيانات الكبيرة" (2. www.foreignaffairs.com/articles/139104/kenneth-neil-cukier-and-viktor-mayer-schoenberger/ معالجة البيانات الكبيرة ) مع مصطلح نقل البيانات. يوصف Datafication بأنها عملية "أخذ جميع جوانب الحياة وتحويلها إلى بيانات". على سبيل المثال. يوفر Facebook الشبكات الشخصية وأجهزة الاستشعار لجميع أنواع الظروف البيئية والهواتف الذكية للاتصالات والحركات الشخصية والبيانات القابلة للارتداء للظروف الشخصية. وهذا يؤدي إلى جمع البيانات وتوافرها تقريبًا.

كما هو الحال في العديد من القطاعات الأخرى ، بدأت الإحصاءات الرسمية في الآونة الأخيرة فقط في مناقشة مشكلة البيانات الضخمة على المستوى الاستراتيجي. لا يوجد حتى الآن فهم مشترك وواسع النطاق للمضي قدمًا ، سواء كان تحديًا أو فرصة ، سواء كانت صغيرة أو كبيرة ، وما إلى ذلك. كجزء من المجموعة رفيعة المستوى بشأن تحديث الإنتاج والخدمات الإحصائية (3 ما حجم البيانات الضخمة؟ استكشاف الدور البيانات الضخمة في الإحصاءات الرسمية: www1.unece.org/stat/platform/download/attachments/99484307/Virtual٪20Sprint٪20Big٪20Data٪20paper.docx؟version=1&modificationDate=1395217470975&api=v2) ، تم إجراء تحليل SWOT الأول متبوعًا بتحليل المخاطر / الفوائد الخام. ولوحظ أن "تحليل المخاطر الشامل سيشمل أيضًا جوانب مثل الاحتمالية والتأثير ، ويمكن أيضًا توسيعه لتحديد استراتيجيات للتخفيف من المخاطر وإدارتها".

على الرغم من أن هذه الوثيقة لا تزال بعيدة عن تحليل كامل للمخاطر ، إلا أنها تهدف إلى تحسين الوضع بدقة من خلال إنشاء أول مراجعة منظمة. نود التأكيد على أنه ينبغي النظر إلى هذه المراجعة كنقطة انطلاق لتحفيز المناقشة العامة داخل المجتمع الإحصائي الرسمي (OSC).

1.2. جسم كروى


هذه المقالة مخصصة حصريًا للمخاطر ، ولا تستبعد المزايا فحسب ، بل أيضًا نقاط القوة والضعف والفرص والتهديدات. وهذا يعني أن "مخاطر التقاعس" (على سبيل المثال ، خطر أن يكون OSC خارج المنافسة مع المشاركين الآخرين إذا لم يتم تحديثه) لا يشمله النطاق ؛ بل هو تهديد. بدلاً من ذلك ، نحاول تسليط الضوء على المخاطر التي قد تنشأ (أ) إذا استفادت OSC من الفرص التي توفرها البيانات الضخمة وبدأت في تطوير أو تحسين "منتج إحصائي رسمي قائم على البيانات الكبيرة" (BOSP) ؛ (ب) مخاطر "الأعمال العادية" الجديدة ، أي مخاطر الإحصاءات الرسمية القائمة على إنتاج "البيانات الضخمة". (نظرًا لأن جميع عمليات إنتاج الإحصاءات الرسمية مرتبطة بالمخاطر ، فإننا نقتصر على (ب) المخاطر الخاصة بالبيانات الضخمة ، أيالمخاطر غير الموجودة أو غير ذات أهمية للعملية "التقليدية" لجمع الإحصاءات الرسمية.)

1.3. بناء


في القسم 2 ، نقدم المبادئ الأساسية المرتبطة بهذه المهمة ، بدءًا بالإطار الضروري الواضح لإدارة المخاطر وإدارة المخاطر (القسم 2.1). نقدم أيضًا هيكل جودة أولي للبيانات الإحصائية التي تم الحصول عليها على أساس البيانات الضخمة (القسم 2.2) ، حيث إن ربط هيكل الجودة بالمخاطر يحقق هدفين:

  • يحدد السياق لتحديد المخاطر. تعبر بعض مؤشرات الجودة ، إلى جانب الخصائص التي تم أخذها بعين الاعتبار ، عن قيم الكائن ، والتي تعتبر مهمة وحاسمة لتقديم الخدمات للعملاء والمستخدمين.
  • يسمح لك هذا بتعيين مخاطر معينة للقياسات النوعية التي يتم تضمينها في المساحات الشديدة الشائعة والمرتبطة بمراحل معينة في إنتاج المنتجات الإحصائية.

في الأقسام 3 و 4 و 5 و 6 ، نقدم المخاطر التي تم تحديدها حتى الآن في سياقات مختلفة (4 وثائق حالة الأعمال الخاصة بـ ESS (https://www.europeansocialsurvey.org/about/structure_and_governance.html) مشروع البيانات الضخمة وكذلك في ESSets Big Data تحتوي على قائمة بالمخاطر المرتبطة جزئياً بالمشروع وجزئياً باستخدام مصادر البيانات الضخمة للأغراض الإحصائية ، تشير الوثيقة "إطار عمل مقترح لجودة البيانات الكبيرة" إلى بعض المخاطر المتعلقة بأبعاد الجودة. تحتوي وثائق حالة مشروع ESS Big Data ، بالإضافة إلى شبكات ESS Big Data ، على قائمة بالمخاطر المرتبطة جزئيًا بالمشروع وتستخدم جزئيًا مصادر البيانات الضخمة لأغراض إحصائية. وقد ورد ذكر بعض المخاطر المقترحة في وثيقة "الهيكل المقترح لجودة البيانات الضخمة" مع مؤشرات الجودة.).هنا نستخدم تصنيف الوصول إلى البيانات ، والبيئة القانونية ، وخصوصية البيانات وأمانها ، وكذلك المهارات ؛ يجب النظر في إعادة التنظيم وفقًا لهيكل جودة الإحصائيات التي يتم الحصول عليها من البيانات الضخمة (القسم 2.2) فور وصول هذا الهيكل إلى حالة أكثر اكتمالاً. بالنسبة لكل من المخاطر المحددة ، فإننا (1) نقدم تقييمًا لاحتمالية وتأثيرها (وفقًا للقسم 2.1.3) و (2) نقترح استراتيجيات للتخفيف من المخاطر وإدارتها (انظر القسم 2.1.4).بالنسبة لكل من المخاطر المحددة ، فإننا (1) نقدم تقييمًا لاحتمالية وتأثيرها (وفقًا للقسم 2.1.3) و (2) نقترح استراتيجيات للتخفيف من المخاطر وإدارتها (انظر القسم 2.1.4).بالنسبة لكل من المخاطر المحددة ، فإننا (1) نقدم تقييمًا لاحتمالية وتأثيرها (وفقًا للقسم 2.1.3) و (2) نقترح استراتيجيات للتخفيف من المخاطر وإدارتها (انظر القسم 2.1.4).

في النهاية ، نناقش نتائجنا ونوجز بعض الخطوات التالية في القسم 7.

2. الأساسيات


2.1. المخاطر وإدارة المخاطر


وفقًا للمعيار ISO 31000: 20095 ، يتم تعريف الخطر على أنه "تأثير عدم اليقين على الأهداف". وهذا يعني أنه يجب تحديد الأهداف أو معرفتها قبل تحديد المخاطر. عادة ما يتم تحديد هذه الأهداف من خلال السياق المؤسسي للمنظمة. هناك اعتبار مهم آخر هو أن المخاطر تحمل توصيفًا لعدم اليقين ، أي أنه ليس من الواضح ما إذا كان الحدث الموصوف سيحدث. وبالتالي ، يتم قياس المخاطر من حيث احتمالية وقوع الحدث وعواقبه ، أي تأثير الحدث على تحقيق أهدافه. يجب أن يوفر تقييم المخاطر معلومات أكثر موضوعية ، والتي ستسمح لك في نهاية المطاف بإيجاد التوازن الصحيح بين تحقيق فرص الربح وتقليل الآثار السلبية.تعد إدارة المخاطر جزءًا لا يتجزأ من ممارسة الإدارة وعنصرًا هامًا من ممارسات الشركات الجيدة (6 إحصائيات كندا: تقرير 2014-2015 عن الخطط والأولويات ،www.statcan.gc.ca/aboutapercu/rpp/2014-2015/s01p06-eng.htm ). إنها عملية تكرارية تسمح بشكل مثالي بالتحسين المستمر لعملية صنع القرار وتساهم في التحسين المستمر للإنتاجية.

ترتبط المخاطر أيضًا بالجودة. إن استخدام نظام الجودة يجب أن يجعل من الممكن استخدام الفرص التي توفرها المصادر والمنهجيات المختلفة لتحقيق نتيجة لمستوى معين من الجودة ، بمعنى أن هذه النتيجة تلبي احتياجات المستخدمين. مثل المخاطر ، يمكن اشتقاق مستويات الجودة من البيئة المؤسسية وأهداف بعض المؤسسات. في هذا السياق ، تحدد البيئة المؤسسية المستوى العام للمخاطر التي تكون المنظمة على استعداد لتحملها لتحقيق أهدافها.

يمكن تقسيم عملية تقييم المخاطر وإدارتها إلى مراحل مختلفة ، بما في ذلك تحديد السياق ، وتحديد المخاطر ، وتحليل المخاطر من حيث الاحتمال والأثر ، وتقييم المخاطر ، وأخيرًا ، معالجة المخاطر.

2.1.1. السياق المؤسسي


كخطوة أولى ، من الضروري إنشاء سياق استراتيجي وتنظيمي وإدارة للمخاطر يتم فيه بقية العملية. وهذا يشمل وضع معايير يتم من خلالها تقييم المخاطر وتحديد هيكل التحليل.

2.1.2. تعريف المخاطر


في المرحلة الثانية ، يجب تحديد الأحداث التي يمكن أن تؤثر على تحقيق الأهداف. يجب أن يشمل التعريف الأسئلة المتعلقة بنوع الخطر ، وتوقيت الحدث ، والمكان ، أو كيف يمكن للأحداث أن تمنع أو تزيد أو تؤخر أو تحسن من تحقيق الأهداف.

2.1.3. تقييم المخاطر


الخطوة التالية هي تحديد الضوابط الموجودة وتحليل المخاطر من حيث الاحتمال ، وكذلك من حيث العواقب المحتملة. في سياق هذه المقالة ، يستخدم احتمال أو احتمال حدوث المخاطر مقياس من 1 (غير مرجح) إلى 5 (متكرر). يتم قياس تأثير الأحداث على مقياس من 1 (ضئيل) إلى 5 (أقصى). كما هو موضح في الجدول 1 ، فإن منتج الاحتمال والأثر له "مستوى خطر" يتراوح من 1 إلى 25.



يمكن مقارنة مستويات المخاطر المقدرة مع المعايير المحددة مسبقًا لتحقيق التوازن بين الفوائد المحتملة والنتائج السلبية. هذا يسمح لك بإصدار أحكام حول أولويات الإدارة.



يجب وضع أولوية العمل على المخاطر الحرجة (انظر الجدول 2) ، أي تلك التي يمكن أن تحدث ولها عواقب وخيمة أو خطيرة على أهداف المنظمة.

2.1.4. الاستجابة للمخاطر


تتكون الخطوة الأخيرة من قرارات حول كيفية الاستجابة للمخاطر. يمكن تجاهل بعض المخاطر التي تكون دون مستوى الخطر المحدد مسبقًا أو التغاضي عنها. بالنسبة للآخرين ، يمكن أن تكون تكاليف التخفيف من المخاطر عالية بحيث تفوق الفوائد المحتملة. في هذه الحالة ، قد تقرر المنظمة التخلي عن الأنشطة ذات الصلة. يمكن أيضًا تحويل المخاطر إلى أطراف ثالثة ، مثل التأمين ، الذي يعوض عن التكاليف المتكبدة. الخيار الأخير هو أخذ المخاطر في الاعتبار عند تحديد الاستراتيجيات والإجراءات التي توازن بين التكاليف والفوائد المحتملة. وبالتالي ، ستقرر المنظمة تنفيذ الاستراتيجيات لزيادة الفوائد وتقليل التكاليف المحتملة إلى الحد الأدنى.



2.2. أنظمة الجودة


وضعت فرقة العمل ، المؤلفة من ممثلين عن المنظمات الإحصائية الوطنية والدولية ، في عام 2014 إطارًا أوليًا للجودة للإحصاءات المستمدة من البيانات الضخمة. عملت فرقة العمل تحت رعاية مشروع UNECE / HLG "دور البيانات الضخمة في تحديث الإنتاج الإحصائي". قام بتوسيع أنظمة الجودة الحالية المصممة لتقييم الإحصاءات من مصادر البيانات الإدارية ، مع مؤشرات الجودة التي اعتبرت ذات صلة بمصادر البيانات الكبيرة.

داخل هذا النظام ، يتم التمييز بين المراحل الثلاث لعملية الأعمال: المدخلات والإنتاجية والمخرجات. تتوافق مرحلة الإدخال مع مرحلتي "التصميم" و "التجميع" من GSBP ، والأداء لمرحلتي "العملية" و "التحليل" ، ويعادل الناتج مرحلة "الانتشار".

يستخدم الهيكل هيكلًا هرميًا ، مأخوذًا من بنية البيانات الإدارية التي طورتها هيئة إحصاءات هولندا (7 Daas ، P. ، S. Ossen ، R. Vis-Visschers ، و J. Arends-Toth ، (2009) ، قائمة مراجعة للجودة تقييم مصادر البيانات الإدارية. إحصاءات هولندا ، لاهاي / هيرلين). يتم تضمين أبعاد الجودة في هيكل هرمي يسمى المساحات الفائقة. الأبعاد الثلاثة المحددة هي "المصدر" و "البيانات الوصفية" و "البيانات". يتم تضمين قياسات الجودة في هذه الأبعاد المفرطة ويتم تعيينها لكل مرحلة من مراحل الإنتاج. بالنسبة لمرحلة الإدخال ، تم اقتراح جوانب إضافية مثل "السرية والسرية" و "التعقيد" (وفقًا لهيكل البيانات) و "اكتمال" البيانات الوصفية و "الاتصال" (القدرة على ربط البيانات بالبيانات الأخرى) ،للإضافة إلى نموذج الجودة القياسي. بالنسبة لكل من مؤشرات الجودة ، يتم اقتراح العوامل المتعلقة بوصفها ، بالإضافة إلى المؤشرات المحتملة.

في سياق هذه المقالة ، يمكن استبعاد المخاطر من هذه العوامل. على سبيل المثال ، العوامل التي يجب أخذها في الاعتبار لقياس جودة البيئة المؤسسية / التجارية هي استدامة مزود البيانات. قد يكون هناك خطر متعلق بعدم توفر البيانات من مزود البيانات في المستقبل. ويتعلق مثال آخر بالجانب المقترح حديثًا للجودة والخصوصية والأمن. أحد العوامل المهمة هو "الإدراك" ، مما يعني التصورات السلبية المحتملة للاستخدام المقصود لمصادر بيانات محددة من قبل مختلف أصحاب المصلحة.

3. المخاطر المرتبطة بالوصول إلى البيانات


3.1. عدم الوصول إلى البيانات
3.1.1. وصف


يتكون هذا الخطر من مشروع يتعلق بتطوير BOSP الذي لا يمكنه الوصول إلى مصدر البيانات الكبير المطلوب (BDS).

حتى الآن ، تعلمت OSC الطريقة الصعبة التي تجعل الخروج من كتل البداية والحصول على هذا الوصول في بعض الأحيان عقبة لا يمكن التغلب عليها. في بعض الأحيان يكون من السهل الوصول إلى مصدر معين ، مثل سجلات بيانات المكالمات (CDR) ، لأغراض الاختبار / البحث ، ولكن من الصعب جدًا (لأسباب قانونية أو تجارية) الوصول إليه لأغراض الإنتاج.

3.1.2. احتمالا


الاحتمال يعتمد إلى حد كبير على خصائص BDS. عندما يتعلق الأمر بالبيانات الإدارية الكبيرة ، يمكن أن تكون صغيرة مثل 1 ، على وجه الخصوص إذا (كما هو الحال مع بيانات حلقة المرور التي درسها Daas et al. 8 Daas ، P. ، M.Puts ، B. Buelens and P. van den Hurk. 2015. "البيانات الضخمة كمصدر للإحصاءات الرسمية". مجلة الإحصاءات الرسمية 31 (2). (قادم ؛ منشور متوقع في يونيو 2015.)) لا توجد مشاكل في حماية البيانات الشخصية. إذا كانت حالة BDS تنتمي إلى فرد خاص ، خاصة إذا كانت حساسة (على سبيل المثال ، من وجهة نظر حماية البيانات) أو قيمة (من وجهة نظر تجارية) ، يمكن أن يكون الاحتمال مرتفعًا جدًا (5).

3.1.3. تأثير


يعتمد التأثير على BOSP والطريقة التي تستخدم بها BDS. إذا كان BDS في المركز ، يمكن أن يكون التأثير مرتفعًا جدًا (4 = لا يمكن إنتاج BOSP على الإطلاق) ، بينما يمكن أن يكون أقل إذا كان لا يزال من الممكن إنتاج BOSP (وإن كان بجودة أقل) ، بالاعتماد على DRM الآخر ، مما يؤدي إلى إلى التعرض في نطاق 2-3.

3.1.4. الوقاية


للحد من خطر نقص الوصول ، يجب عليك إنشاء اتصالات أولية مع مزود البيانات والدخول في اتفاقية وصول طويلة الأمد للبيانات. بالإضافة إلى ذلك ، ينبغي إجراء مراجعة قانونية شاملة فيما يتعلق بمزيج محدد من BDS و BOSP. يجب أيضًا تقييم إمكانيات الوصول إلى البيانات باستخدام التشريعات الحالية أو المستقبلية.

3.1.5. تليين


إذا كان هناك BDS بديلة يمكن استخدامها لـ BOSP ، فيمكن استكشافها بدلاً من ذلك. إذا لم تكن هناك طريقة لإنتاج BOSP بدون BDS ، وإذا كان من المستحيل التغلب على نقص الوصول ، فيجب إيقاف الجهود ولن يتم إصدار BOSP الجديد.

3.2. فقدان الوصول إلى البيانات
3.2.1. وصف


هذا الخطر هو أن المكتب الإحصائي يخسر BDS الأساسي BOSP.

3.2.2. احتمالا


إذا كان BOSP يتم إنتاجه بالفعل ، فعادة ما يكون هناك بعض الاستقرار ، وفي بعض الحالات يمكن أن يكون الخطر منخفضًا جدًا (1). ومع ذلك ، على وجه الخصوص ، في حالة الكيانات الخاصة التي أبرمت معها اتفاقات غير كافية ، لا شيء يتدخل ، على سبيل المثال. إرشادات جديدة من تغيير سياسات الإبلاغ عن البيانات ، مما يؤدي إلى خطر معتدل لوجود فجوة (3). علاوة على ذلك ، إذا كانت BDS مرتبطة بأنشطة غير مستقرة ، فهناك دائمًا خطر أن يفلس المزود ببساطة ، وقد تكون المخاطر أعلى (4).

3.2.3. تأثير


نظرًا لأنه قد لا يكون من الممكن تصنيع BOSP الحالي ، فغالبًا ما يحدث تأثير قوي جدًا (5). في حالات أخرى ، عندما يكون BDS مساعدًا ، قد يكون التأثير بدلاً من ذلك فقدانًا للجودة مع تأثير في نطاق 2-3.

3.2.4. الوقاية


تتشابه استراتيجية الوقاية مع استراتيجية نقص الوصول إلى البيانات ، ولكن مع زيادة التركيز على اليقظة المستمرة أيضًا في بيئة الإنتاج.

يمكن أن يكون عدم وضع كل بيضك في سلة واحدة (أي وجود العديد من BDS الكامنة وراء كل BSOP) استراتيجية ، ولكنه قد يكون غير عملي أو مكلفًا للغاية.

3.2.5. تليين


إذا كانت BDS نتيجة لأنشطة غير مستدامة ، فمن الممكن أن تتوافر BDS جديدة تعكس نفس الظاهرة الاجتماعية تدريجيًا. ومع ذلك ، سيكون قد فات الأوان لبدء "مسح السوق" بمجرد تعطل BSOP ؛ ستكون هناك حاجة إلى اليقظة المستمرة - وهذا قد يكون من الصعب تحقيقه.

4. المخاطر القانونية


4.1. عدم الامتثال للتشريعات ذات الصلة
4.1.1. وصف


يتكون هذا الخطر من مشروع يتعلق بتطوير BOSP ، والذي لا يأخذ في الاعتبار التشريعات ذات الصلة ، مما يجعل BOSP غير متسق مع التشريعات المحددة. قد ينطبق هذا على تشريعات حماية البيانات وعبء الاستجابة التنظيمي وما إلى ذلك.

4.1.2. احتمالا


بالنظر إلى جهل OSC للبيانات الضخمة ، فمن الممكن أن يحدث عدم الامتثال العرضي (3). عادة ما يرتبط الاحتمال بـ BDS ، نظرًا لأن المصدر أقل "حساسية" ، كلما قل احتمال إنشاء عدم تطابق.

4.1.3. تأثير


عادة ما يكون التأثير بالغ الأهمية (4) بمعنى أنه بالنسبة للإنتاج غير المناسب سيكون من الضروري إيقاف BOSP (أو ، إذا لم يكن قد وصل بعد إلى مرحلة التنفيذ ، فيجب إيقاف تطويره). يمكن أن تكون شديدة (5) ، حيث أن مخاطر السمعة الناشئة عن الإحصاءات الرسمية ("غير القانونية") غير الملائمة يمكن أن يكون لها عواقب

4.1.4. الوقاية


بالنسبة لأي BOSP ، من الضروري إجراء تحليل قانوني شامل - وهذا يحدث في عدة مراحل (ما هو مقبول في مرحلة التطوير / الاستكشاف قد لا يكون صحيحًا في مرحلة التنفيذ / الإنتاج). وهذا بدوره يمكن أن يؤدي إلى إعادة هندسة BOSP لجعلها متوافقة.

4.1.5. تليين


اعتمادًا على شدة التناقض ، قد تكون الخطوة الأولى هي جعل BOSP في وضع عدم الاتصال.

قد تكون إعادة هندسة BOSP لجعلها متوافقة خيارًا ، ولكن ما إذا كان BOSP "محفوظًا" بهذه الطريقة يعتمد بشكل كبير على طبيعة عدم التطابق.

4.2. التغييرات السلبية في البيئة القانونية
4.2.1. وصف


يمكن إدخال تشريعات جديدة تتعلق بتطوير BOSP ، مما يجعل BOSP غير متوافق بشكل فعال.

4.2.2. احتمالا


من الممكن أن يكون مؤيدو حماية البيانات المعززة قادرين على إدخال متطلبات جديدة تؤثر بشكل مباشر أو غير مباشر على القدرة على إنشاء BOSPs محددة. يبدو أن الاحتمال في نطاق 2-3 تقدير واقعي.

4.2.3. تأثير


عادةً ما يكون التعرض حرجًا (4) ، بمعنى أن الإنتاج غير المناسب سيتطلب إيقاف تشغيل BOSP.

4.2.4. الوقاية


يجب إجراء بعض المعلومات التجارية بانتظام لمراقبة تطور التشريعات - وربما أيضًا من أجل التأثير عليها ، وتقديم الحجج لصالح الإحصاءات الرسمية في المنتديات ذات الصلة (على سبيل المثال ، الاستشارات).

4.2.5. تليين


شريطة أن يتم تنفيذ رصد استباقي ، قد يكون هناك وقت لإعادة هندسة BOSP لجعلها تتماشى مع التشريع الجديد من اليوم الأول من دخولها حيز التنفيذ.

من ناحية أخرى ، إذا لم يتم تنفيذ المراقبة ، بحيث يصبح التشريع الجديد "مفاجأة" ، أو إذا كان التشريع جذريًا للغاية بحيث لا توجد طريقة لجعل BOSP غير متوافق ، فإن الخيار الوحيد هو تعطيل BOSP.

5. المخاطر المرتبطة بخصوصية وأمن البيانات


5.1. انتهاكات أمن البيانات
5.1.1. وصف


يتعلق هذا الخطر بالوصول غير المصرح به إلى البيانات المخزنة في المكاتب الإحصائية. قد تتلقى أطراف ثالثة بيانات خاضعة للحظر ، على سبيل المثال ، بسبب إصدار الجدول الزمني (9 بالنسبة لأي BOSP يعتمد بالكامل على BDS واحدة ، فمن المحتم أن تكون البيانات معروفة ضمنيًا لمالك البيانات الأصلي ، وإذا كانت المنهجية شفافة ، إحصائيات مشتقة أيضًا هذه الحالة لم يتم تناولها هنا ، بل في خطر إساءة استخدام السلطة من قبل المالكين.) (10 بالإضافة إلى ذلك ، قد تحمل هذه البيانات خطر انتهاك السرية. سيتم النظر في هذا الخطر بشكل منفصل.). قد تكون هذه ، على سبيل المثال ، البيانات التي يتوقعها المستثمرون في سوق الأسهم.

5.1.2. احتمالا


فيما يتعلق بالجوانب التقنية لحماية بيئة تكنولوجيا المعلومات في المكتب الإحصائي ، فإن الخطر محتمل بالنسبة إلى BDSs مثل المصادر التقليدية. ومع ذلك ، هناك جانبان إضافيان يجب مراعاتهما.

أولاً ، مع بعض الخدمات الداعمة للأعمال ، يزداد الخطر الإجمالي قليلاً بسبب حقيقة أن أمن البيانات للمالك الأصلي قد يتعرض للخطر. قد يكون هذا ، على سبيل المثال ، بسبب التجسس الصناعي أو القرصنة.

ثانيًا ، بمجرد تخزين البيانات ذات القيمة المحتملة في المكتب ، سيزداد خطر جذب النوايا الخبيثة. إذا كانت البيانات المخزنة ذات قيمة عالية جدًا للأعمال ، فيجب أن تكون مستعدًا لاحتمال كبير جدًا للهجمات التي تستهدف البنية التحتية لتكنولوجيا المعلومات ، وبالتالي قد يكون احتمال الاختراق أعلى (4).

إذا لم يُنظر إلى البيانات المخزنة على أنها ذات قيمة ، فلا يبدو أن الاحتمال العام مرتفع للغاية - من (1) إلى (3) اعتمادًا على مصدر البيانات.

5.1.3. تأثير


يمكن أن يكون الضرر المحتمل لسمعتك كبيرًا (5). المهم في حالة BDS هو أنه إذا حدث خرق للأمان مع المالك الأصلي ، فمن المتوقع أن يكون التأثير على سمعة المكتب الإحصائي أقل مما لو حدث الخرق مع البيانات المخزنة فيه.

من ناحية أخرى ، من الممكن أن يكون للانتهاك في المكتب الإحصائي عواقب سلبية على المالك الأصلي. في هذه الحالة ، من الممكن حدوث تأثير سلبي قوي مرة أخرى بسبب الضرر من حيث الثقة بين المورد والمكتب الإحصائي (5).

5.1.4. الوقاية


ما يميز حالة BDS هو أن الإجراءات الأمنية للمالك الأصلي قد تكون مناسبة. من غير المحتمل أن يكون لدى المكاتب الإحصائية أوراق اعتماد المراجعة للسيطرة على ذلك. يجب إبلاغ الملاك الذين يتم استخدام بياناتهم لعمل سجلات بجداول النشر السرية بالآثار المترتبة على الإحصائيات الرسمية للانتهاكات الأمنية المحتملة في أماكن عملهم ويجب أن يتلقوا ضمانًا رسميًا بتطبيق الإجراءات الأمنية المناسبة.

من الطرق المباشرة لمنع حدوث تأثير خطير لخرق أمني في مباني المالك في المكتب الإحصائي استخدام مصادر متعددة لنفس المنتج بحيث لا يكون مصدر واحد مخترق كافيًا للحصول على الرقم النهائي. ميزة هذا النهج هو أن المزيد من السيطرة في أيدي المكتب الإحصائي.

تتمثل طريقة منع العواقب السلبية لخرق أمني في المكتب الإحصائي لمالك البيانات الأصلي في إيجاد طريقة للعمل لا تنطوي على نقل البيانات التي قد تكون حساسة من وجهة نظر المالك إلى المكتب الإحصائي. في شكل خام. نهج وقائي محتمل هو استخدام البيانات المجمعة. ومع ذلك ، يجب أن نتذكر أن بعض أشكال التجميع ، على سبيل المثال ، تلك المصممة لمنع تحديد الأفراد من السكان ، قد لا تكون مناسبة في هذه الحالة. قد يكون أحد أسباب ذلك حقيقة أن الخطر على المالك مرتبط بالقيمة التجارية للبيانات ، والتي يمكن أن تكون كبيرة حتى بعد تحقيق عدم الكشف عن هويته.

5.1.5. تليين


في حالة انتهاك البيانات التي يديرها المكتب الإحصائي ، ستكون إجراءات التخفيف هي نفسها كما في حالة المصادر التقليدية ، إذا لم يكن هناك تأثير سلبي على المالك الأصلي.

في حالة حدوث عواقب سلبية على المالك الأصلي ، يجب على المكتب الإحصائي مراجعة إجراءاته الأمنية وتعزيزها والتواصل بوضوح وإظهار التزامه بذلك.

إذا حدث الانتهاك في مباني المالك الأصلي ، فيجب على المكتب الإحصائي المعني الإبلاغ بوضوح عن الوضع والإصرار على تحسين إجراءات سلامة المالك. إذا لزم الأمر ، يمكنك البحث عن مورد بديل.

5.2. خرق خصوصية البيانات


5.2.1. وصف


هذا خطر انتهاك سرية شخص أو أكثر من السكان الإحصائيين. قد يكون هذا بسبب هجوم على البنية التحتية لتكنولوجيا المعلومات بسبب الضغط من الوكالات الحكومية الأخرى أو بسبب عدم كفاية الضوابط على الكشف عن الإحصاءات.

5.2.2. احتمالا


كما هو الحال مع مخاطر اختراق أمان البيانات ، لا تتغير مواصفات تخزين البيانات الجزئية كثيرًا مع إضافة BDS. ومع ذلك ، هناك تحذيرات هنا.

يمكن أن تكون البيانات الجزئية من مصادر بيانات معينة ذات قيمة تجارية عالية ، لذا فإن تخزينها سيزيد من احتمال وقوع هجمات.

بالإضافة إلى ذلك ، قد تكون بعض البيانات الجزئية مفيدة جدًا للوكالات الحكومية الأخرى ، مثل تطبيق القانون أو الضرائب أو الرعاية الصحية. في ظروف معينة ، قد يخضع الالتزام بمبدأ السرية الإحصائية لضغوط كبيرة.

أما فيما يتعلق بالفشل في التحكم في الكشف عن المعلومات الإحصائية ، فهناك بالفعل ممارسة راسخة. قد تسمح BDS بإنتاج الإحصاءات لمجموعات فرعية صغيرة من السكان أو توفر القدرة على ربط البيانات المجمعة من BDSs المختلفة ، مما قد يزيد من خطر المخاطر. بالإضافة إلى ذلك ، ستتطلب مصادر جديدة تطورات منهجية جديدة ، لذا فإن الخطر الحقيقي هو أن منهجية ضبط الكشف لم يتم تحديثها بشكل صحيح.

بشكل عام ، مع التدابير الوقائية المعقولة ، يمكن الحفاظ على الاحتمال عند مستويات معقولة ، ولكن نظرًا لوجود العديد من العوامل المختلفة والمتنوعة ، يبدو أن التقييم المقابل هنا هو أن الاحتمال مرتفع (4).

5.2.3. تأثير


يمكن أن يكون الضرر المحتمل لسمعتك كبيرًا (5). كما هو الحال مع خطر اختراق البيانات ، يمكن أن يكون لاختراق المكتب الإحصائي عواقب سلبية على المالك الأصلي. هنا يمكن أن يكون تأثير مثل هذا الحدث أكبر ، خاصة إذا استمرت الاتجاهات الحالية في الرأي العام. ومن المتوقع أيضًا أن يكون الضرر بين مزود البيانات والمكتب الإحصائي كبيرًا جدًا.

5.2.4. الوقاية


من الطرق التي لا لبس فيها لمنع هذا الخطر عدم وجود بيانات جزئية من BDS على الإطلاق (على الرغم من أن تخزين البيانات الجزئية الأخرى لا يزال يحمل خطرًا مناظرًا ، وإن كان ذلك مع احتمال وتأثير مختلفين). وبهذه الطريقة ، كما هو الحال بالنسبة لخطر اختراق أمان البيانات ، ستترتب على الحاجة إلى تطوير طرق أخرى لاستخدام البيانات لأغراض إحصائية. بالإضافة إلى ذلك ، ستعني الطبيعة المختلفة للمصادر هنا أنه سيكون من الضروري تطوير منهجيات جديدة ذات أهداف متنافسة لاستخراج أكبر قدر ممكن من المعلومات المفيدة وحماية الخصوصية من الخطر.

في حالة تخزين البيانات الجزئية ، يجب أن يكون أمن تكنولوجيا المعلومات وآليات التحكم في الوصول عند المستوى المطلوب ومراقبتها باستمرار. يجب إيلاء اهتمام خاص لضمان أمن الطرق الجديدة للحصول على البيانات. ومن المفارقات أن هذه الطريقة الجديدة يمكن أن تكون النقل المادي لأجهزة التخزين (مثل محركات الأقراص الثابتة). إذا تم استخدام هذه الطريقة ، فيجب أن يكون التسليم آمنًا جسديًا ويجب استخدام التشفير.

5.2.5. تليين


تدابير التخفيف هنا هي في الأساس نفسها كما هو الحال في حالة خروقات أمن البيانات. إذا كان سبب الانتهاك هو الضغط من وكالة حكومية أخرى ، فيجب عليك اغتنام الفرصة لتعزيز استقلالية الحكم بحيث تصبح هذه الانتهاكات أكثر صعوبة في المستقبل.

5.3. التلاعب بمصدر بيانات
5.3.1. وصف


إن موفري بيانات الأطراف الثالثة ، مثل بيانات الوسائط الاجتماعية أو البيانات المقدمة طواعية ، معرضون لخطر التلاعب. يمكن القيام بذلك إما من قبل مزود البيانات نفسه أو من قبل أطراف ثالثة. على سبيل المثال ، يمكن إنشاء العديد من الرسائل الخاطئة على الشبكات الاجتماعية من أجل دفع المؤشر الإحصائي الذي تم الحصول عليه على أساس هذه البيانات بطريقة أو بأخرى ، إذا كان معروفًا أن المؤشر يتم حسابه على أساس هذه البيانات.

بالنسبة للبيانات المقدمة طواعية ، قد تكون هناك أوقات يمثل فيها المتطوعون مجموعة اهتمامات محددة بجدول أعمال محدد.

5.3.2. احتمالا


بالنسبة للبيانات التي يمكن أن يكون معالجتها ذات فائدة كبيرة ، فإن الاحتمال أعلى. يمكن أن تكون هذه بيانات للإحصاءات المثيرة للاهتمام ، على سبيل المثال ، سوق الأسهم. في ضوء الفضائح الأخيرة المتعلقة بـ LIBOR و Forex ، يمكن الافتراض أنه طالما كان هناك حافز ، فمن المحتمل أن تكون هناك محاولات للتعامل مع البيانات.

بالنسبة للإحصاءات القائمة على البيانات المقدمة طواعية ، ما عليك سوى إلقاء نظرة على ممارسة العلاقات العامة الأخيرة لتوظيف الأشخاص الذين يدعون أن لديهم رأيًا معينًا ويتقاضون أجرًا مقابل التعبير العام (على سبيل المثال ، في منتديات الإنترنت) لاستنتاج أن الاحتمال ليس صغيراً . بشكل عام ، يبدو الرقم 3 إلى 4 كافياً.

5.3.3. تأثير


المشكلة الكبرى في التلاعب هي أنها يمكن أن تستمر لفترة طويلة دون اكتشاف. إذا استمر التلاعب لفترة طويلة ، يمكن أن يصبح التأثير على الجودة كبيرًا. بالإضافة إلى ذلك ، يمكن أن يكون الضرر الذي يلحق بثقة الجمهور في الإحصاءات الرسمية كبيرًا أيضًا ، خاصةً إذا تم التأكيد على دور المكاتب الإحصائية كمزود للبيانات عالية الجودة. من ناحية أخرى ، إذا تم الكشف عن التلاعب في الوقت المحدد ثم تم نشره ، فقد يؤدي ذلك في الواقع إلى تحسين الإدراك العام. باستثناء الحالات السيئة للغاية ، يمكن للمرء أن يتخيل أقصى تأثير (3).

5.3.4. الوقاية


يعد إجراء تمارين التحكم المنتظمة مع المصادر البديلة أحد الأساليب الوقائية الممكنة. قد تكون هذه المصادر البديلة تقليدية أو مختلفة. يمكن أن يتداخل استخدام الإحصائيات القائمة على مجموعة من المصادر مع التأثيرات المهمة للتلاعب. في الحالات التي يخافون فيها من التلاعبات التي يبدأها المزود ، يمكن أن تكون الاتفاقات القانونية أيضًا إحدى الطرق لمنع مثل هذه الممارسات.

5.3.5. تليين


فيما يتعلق بالضرر الذي يلحق بالعلاقات العامة ، فإن التدابير المخففة التي ينبغي اتخاذها هنا لا تختلف كثيراً عن تدابير مكافحة أي أزمة.

من حيث جودة البيانات ، سيكون من المفيد أن يتم تصحيح البيانات السابقة بحيث يمكن
إنتاج السلسلة الصحيحة حتى مع التأخير الكبير . قد يكون القياس المنتظم مفيدًا لذلك. يرجى ملاحظة أن هدف القياس في هذه الحالة يختلف قليلاً عن هدف الوقاية. لمنع حدوث ذلك ، من المهم تحديد عدم التطابق المشبوه بين البيانات المرجعية و BDS والتحقيق فيها بسرعة. للتخفيف من آثار البيانات المفيدة القديمة مفيد دائمًا.

بالإضافة إلى ذلك ، يجب توخي الحذر لمنع التلاعبات المماثلة في المستقبل - في الحالات الدقيقة بشكل خاص ، قد يعني هذا تلقي بيانات زائدة محتملة من العديد من الموردين للتحليل المقارن.

5.4. التصور العام الضار لاستخدام البيانات الضخمة من خلال الإحصاءات الرسمية
5.4.1. وصف


إن وسائل الإعلام وعامة الناس حساسون للغاية لقضايا السرية واستخدام البيانات الشخصية من مصادر البيانات الضخمة ، خاصة في سياق الاستخدام الثانوي للبيانات من قبل الوكالات الحكومية التي تتخذ تدابير إدارية أو قانونية ضد المواطنين. قد يكون الاستخدام المدرك بشكل سلبي هو وضع التحكم في السرعة استنادًا إلى تحليل بيانات الملاحة (11 انظر www.theguardian.com/technology/2011/apr/28/tomtom-satnav-data-police-speed-traps ).
تسببت حالة معينة من TomTom Netherlands في انخفاض كبير في الطلب على أجهزة TomTom وأدت إلى قرار الشركة بتقييد الوصول إلى البيانات. في هذه الحالة بالذات ، تتعلق البيانات بالأفراد ، ولكن بمستويات السرعة على طول أجزاء من الطريق.

ومع ذلك ، قد تكون هناك تطبيقات ذات بيانات كبيرة يتم استقبالها بشكل جيد من قبل الجمهور. أحد الأمثلة على ذلك التطبيقات التي تمنع الجرائم مثل السطو على طرق البيانات الضخمة.

يمكن أن يكون للرأي العام الإيجابي والسلبي تأثير قوي على استخدام BDS في سياق إنتاج الإحصاءات الرسمية.

قد تكون نتيجة التصور العام السلبي أن:

  • لن تكون BDS متاحة بعد الآن للمكاتب الإحصائية ، إما بسبب قرارات مزود البيانات أو القرارات الحكومية بعدم استخدام البيانات ، أو
  • سيكون استخدام البيانات محدودًا ، والذي قد يتداخل مع الإنتاج إذا كان BOSP معينًا.

5.4.2. احتمالا


العوامل التي قد تؤثر على احتمالية وقوع مثل هذا الحدث أو تأثيره على إنتاج الإحصائيات:

  • سرية البيانات ، أي مدى سهولة التعرف على الأشخاص ؛
  • يتم زيادة كمية المعلومات التي يتم الكشف عن البيانات حول الأفراد ، على سبيل المثال ، عن طريق ربط البيانات من مصادر مختلفة ؛
  • نوع البيانات ، على سبيل المثال ، يُنظر إلى المعاملات المالية على أنها أكثر سرية من البيانات الأخرى ؛
  • نوع الإجراء المحتمل الذي يمكن اتخاذه ضد المواطنين ، على سبيل المثال ، الأشخاص الجيدين للسرعة ؛
  • بيئة قانونية غامضة يعمل فيها موفرو البيانات ومستخدموها أو عندما تتعارض الشروط القانونية مع الآراء / المعايير الأخلاقية العامة ؛
  • ; . , , . , , .

لا يمكن تقدير وقت الأحداث المعاكسة ، لأن التعبئة العامة غالبًا ما يتم تشغيلها من خلال تغطية الأحداث التي تؤثر سلبًا على المواطنين. ومع ذلك ، مع الاستخدام المتزايد للبيانات الضخمة من قبل الحكومات والمؤسسات الخاصة ، وخاصة مع التسويق النشط للبيانات لأغراض أخرى غير تلك التي أدت إلى جمعها الأولي ، فمن المرجح أن تحدث مثل هذه الأحداث.

الأحداث التي تؤثر بقوة على الإدراك العام ليست متكررة ، ولكنها عشوائية (3) وبعيدة (2). مع زيادة استخدام مصادر البيانات الكبيرة ، ستزداد الاحتمالية أيضًا.

5.4.3. تأثير


يعتمد تأثير الحدث بشكل كبير على العوامل التي نوقشت أعلاه. بشكل عام ، يكون التأثير أكثر خطورة بالنسبة للإنتاج القائم بالفعل للبيانات الإحصائية ، لأنه ربما يجب إنهاء الإجراء. يعتمد التأثير أيضًا على توفر مصادر بيانات بديلة ، على الرغم من أنه قد يحدث أن الإدراك العام لا يميز بين مصادر البيانات المختلفة في حالة تجسيد الحدث. في الوضع الحالي لاستخدام البيانات الضخمة ، يبدو أن هذه المصادر لا يمكن أن تحل محل مصادر البيانات التقليدية تمامًا ، بل تكمل الإحصائيات الحالية. سيؤدي ذلك إلى تقليل تأثير الأحداث. لذلك ، يتم النظر في تأثير الحدث في النطاق من 2 (غير ذي أهمية) إلى 3 (رئيسي). في مرحلة الإنتاج ، قد يزيد التأثير إلى 4 (قيمة حرجة).

5.4.4. الوقاية


يمكن أن تكون التدابير الوقائية تعريف المبادئ الأخلاقية للبيانات الضخمة في الإحصاءات الرسمية. يجب أن تستند المبادئ التوجيهية الأخلاقية إلى مبادئ مثل مدونة قواعد الممارسة للإحصاءات الأوروبية أو المبادئ الأساسية للإحصاءات الرسمية (12 unstats.un.org/unsd/dnss/gp/fundprinciples.aspx ). ستكون الخطوة التالية هي تحديد استراتيجية اتصال تنشر نتائج المبادئ التوجيهية الأخلاقية للجمهور ويمكن استخدامها لإبلاغ أصحاب المصلحة حول الاستخدام الأخلاقي لـ BDS لـ BOSP.

يمكن إجراء تقييم مخاطر منفصل لـ BDS محدد لتحديد المخاطر واقتراح الإجراءات الوقائية أو المخففة على أساس المبادئ الأخلاقية. قد يشمل تقييم المخاطر المنفصل أيضًا أصحاب المصلحة ، مثل وكالات حماية البيانات ، لضمان تحديد جميع المخاطر وتبرير الإجراءات.

5.4.5. تليين


يجب أن تتضمن استراتيجية الاتصال أيضًا تدابير في حالة تزايد المواقف العامة السلبية. يجب أن يجمع تقييم المخاطر المنفصل أمثلة إيجابية على استخدام البيانات والتدابير لمنع إساءة استخدام البيانات ، والتي قد يتم اتخاذها بالضرورة على المستوى السياسي ، وقد لا يتمكن المجتمع الإحصائي من التأثير عليها بشكل فعال.

5.5. فقدان الثقة - لم يتم الحصول عليه نتيجة الملاحظة
5.5.1. وصف


عادة ما يثق مستخدمو الإحصائيات الرسمية في دقة وموثوقية الإحصائيات. ويستند هذا إلى حقيقة أن إنتاج البيانات الإحصائية مدمج في قاعدة منهجية موثوقة ويمكن الوصول إليها ، وكذلك وثائق حول جودة المنتج الإحصائي. بالإضافة إلى ذلك ، تعتمد معظم الإحصائيات على الملاحظات ، أي تم الحصول عليها من المسوحات أو التعدادات التي تقيم علاقة يسهل فهمها بين الملاحظة والإحصاءات. إن استخدام BDS ، التي لم يتم جمعها للغرض الرئيسي من الإحصاءات ، ينطوي على خطر فقدان هذه العلاقات وفقد المستخدمين الثقة في الإحصاءات الرسمية. يرتبط مثال آخر للجولة الأخيرة (2010) من التعدادأنه في بعض البلدان ، تم الحصول على الإحصاءات باستخدام عدة مصادر ونماذج إحصائية. في عدد من الحالات ، اعترض أصحاب المصلحة على الإحصاءات.

5.5.2. احتمالا


يعتمد احتمال وجود خطر على عوامل مثل تعقيد النموذج الإحصائي / المنهجي ، وموثوقية العلاقة بين BSD و BOSP ، أو ما إذا كانت الإحصاءات الأخرى متسقة. يجب أن يكون الاحتمال في نطاق 3 (عشوائي) إلى 4 (محتمل) ، مما يعني أن هذا يمكن أن يحدث عدة مرات أو في كثير من الأحيان.

5.5.3. تأثير


سيعتمد تأثير حدوث المخاطر إلى حد كبير على ما إذا كان بإمكان مكاتب الإحصاء الوطنية إثبات دقة وموثوقية الإحصاءات. إذا لم يمكن تحقيق ذلك ، فقد يؤثر التأثير من وجهة نظر فقدان الثقة والثقة أيضًا على مجالات إحصائية أخرى ، أي موثوقية بعض البيانات الإحصائية فحسب ، بل يلقي أيضًا بظلال من الشك على المنظمة نفسها. ستفقد NSOs الميزة التنافسية على المنظمات الخاصة الأخرى النشطة في هذا المجال.

5.5.4. الوقاية


ستتألف الإجراءات الوقائية في تطوير ونشر منهجية علمية معترف بها من قبل المجتمع العلمي ، وإثراء البيانات ببيانات التعريف في الجودة ، وضمان اتساق BOSP مع غير BOSP ، وتنفيذ مراقبة صارمة للجودة.

قبل الشروع في الإنتاج الإحصائي ، يمكن نشر BOSP كإصدار تجريبي ، وسيتم تشجيع الأطراف المعنية على تحدي BOSP من أجل التحقق من BOSP أو تحسينه.

5.5.5. تليين


هناك حالتان للتمييز. إذا كانت الإحصائيات متنازع عليها ولكن ذات جودة عالية / كافية (صحيحة / دقيقة) ، فسيكون ذلك كافياً لشرح الإحصاءات وعرضها على الجمهور ، وتقديم أمثلة بسيطة لفهمها.

6. مخاطر المهارات


6.1.
6.1.1.


يتطلب تحليل الآثار الرقمية التي تركها الأشخاص أثناء أنشطتهم أدوات معينة لتحليل البيانات ، وهي ليست الأكثر شيوعًا حاليًا في الإحصاءات الرسمية. أولاً ، يتطلب استخدام البيانات غير المباشرة حول أنشطة الأشخاص بدلاً من الاستطلاعات المباشرة في الاستطلاعات استخدام النماذج الإحصائية ، وبالتالي مهارات الاستدلال والتعلم الآلي. ثانيًا ، تتكون هذه السجلات الرقمية من البيانات التي غالبًا لا تحتوي على تنسيق الجدول المعتاد المعتاد لنتائج المسح ، مع صفوف تتوافق مع وحدة إحصائية وأعمدة ذات خصائص محددة لهذه الوحدات الإحصائية. يتم تقديم المسارات الرقمية أيضًا في شكل نص وصوت وصورة وفيديو.يتطلب استخراج المعلومات الإحصائية ذات الصلة من أنواع البيانات هذه مهارات في معالجة اللغات الطبيعية ومعالجة الصوت ومعالجة الصور. ثالثًا ، تميل مصادر البيانات هذه إلى توفير مجموعات بيانات ضخمة ، تتطلب معالجتها فهمًا جيدًا لمنهجيات الحوسبة الموزعة.

يكمن خطر النقص في الخبراء في الحصول على البيانات من أحد مصادر البيانات الضخمة الجديدة هذه ، حيث إن المكتب الإحصائي غير قادر على معالجتها وتحليلها بشكل صحيح بسبب حقيقة أن موظفيه لا يمتلكون المهارات اللازمة.

6.1.2. احتمالا


يعتمد احتمال هذا الخطر على ثلاثة عوامل: 1) الأنواع المحددة من المهارات اللازمة لكل نوع من مصادر البيانات الضخمة ، واحتمال أن يجد المكتب الإحصائي الفرصة لدراسة مثل هذا المصدر ؛ 2) التوافر الحالي للمهارات اللازمة في الإدارة الإحصائية ؛ 3) الثقافة التنظيمية للمكتب الإحصائي.

فيما يتعلق بأنواع المهارات التي قد تكون مطلوبة ، تجدر الإشارة إلى أن المصادر لا تتطلب جميع المهارات المذكورة أعلاه. بعض (على سبيل المثال ، بيانات مثل Google Trends) لا تتطلب حوسبة موزعة ، حيث تتم معالجتها مسبقًا من صاحب البيانات أو لديهم مهارات معالجة الإشارات ، وستتطلب بشكل أساسي مهارات النمذجة الإحصائية. ومع ذلك ، هناك مجموعة متنوعة من مصادر البيانات الضخمة ، والتي يتطلب معظمها مهارات في الحوسبة الموزعة ومعالجة الإشارات وتعلم الآلة. وفي الوقت نفسه ، يتطلب التحقيق المناسب لهذه المسارات الرقمية معالجة عدة مصادر. وبالتالي ، هناك احتمال كبير بأن مصادر البيانات الكبيرة المتاحة للمكتب الإحصائي تتطلب هذه المهارات غير العادية ،واحتمال حدوث هذا الخطر مرتفع للغاية (5).

فيما يتعلق بالتوافر الحالي للمهارات اللازمة ، يعتمد ذلك على المكتب الإحصائي الخاص. حتى إذا كانت منهجية المسح أقل شيوعًا من منهجية المسح ، فإنها تُستخدم أيضًا في الإحصاءات الرسمية في المجالات الفردية. لذلك ، حتى لو كان هذا قد يتطلب إعادة توزيع الموارد البشرية ، يمكن للمكاتب الإحصائية إيجاد حل بمفردها. أما بالنسبة لمهارات الحوسبة الموزعة ، والتي تتعلق بشكل أساسي بتكنولوجيا المعلومات ، فسوف تعتمد على كيفية إدارة البنية التحتية لتكنولوجيا المعلومات في المؤسسة. اعتمادًا على مدى وجودك خارج قسم تكنولوجيا المعلومات ، يمكن العثور على حلول في سياق الترتيبات الحالية. ومع ذلك ، لا تتوافر مهارات معالجة الإشارات والتعلم الآلي بشكل عام في معظم المكاتب الإحصائية الرسمية ،ولا يمكن الاستعانة بمصادر خارجية لتطبيق هذه المهارات ، حيث يجب أن يطبقها خبراء في مجال الإحصاء. لذلك ، من وجهة النظر هذه ، يبدو احتمال حدوث هذا الخطر مرتفعًا جدًا (5).

ستؤثر الثقافة التنظيمية أيضًا على احتمالية حدوث هذا الخطر. يمكن أن يكون امتلاك الموظفين جاهزين لاكتساب المهارات اللازمة من خلال التعلم الذاتي يمكّن المنظمة من الاستجابة للموقف من خلال مصدر بيانات جديد يتطلب مهارات غير عادية. سيعتمد ذلك على الثقافة التنظيمية للمكتب الإحصائي ، وتحديداً على ما إذا كان سيشجع الموظفين على تعلم مهارات جديدة وما إذا كان هذا يتيح للموظفين الوقت للتدريب المستقل.

وبالتالي ، فإن احتمال عدم قدرة المكتب الإحصائي على معالجة وتحليل مصادر البيانات الجديدة بسبب نقص المهارات بين موظفيه سيكون بين (4) ومتكرر (5) اعتمادًا على ثقافة التعلم الذاتي للمؤسسة.

6.1.3. تأثير


يمكن لمكتب إحصائي غير قادر على معالجة وتحليل مصادر البيانات الضخمة بسبب نقص المهارات بين موظفيه أن يكون له عواقب سلبية محتملة: 1) لن تتم دراسة مصدر البيانات ، على الأقل ليس بشكل كامل ؛ 2) سيتم إساءة استخدام المصدر.

سيكون لنقص القدرة على استكشاف إمكانات مصدر قيم للبيانات الضخمة بشكل كامل تأثير ضئيل (2) على المدى القصير ، نظرًا لأن المكاتب الإحصائية لديها بالفعل أدوات إحصائية لتلبية الاحتياجات الحالية. ومع ذلك ، على المدى الطويل (وربما حتى على المدى المتوسط) ، ستكون عواقب فقدان هذه الفرصة حاسمة (4) ، حيث تواجه المكاتب الإحصائية بشكل متزايد منافسة من مقدمي الخدمات من القطاع الخاص الذين ليس لديهم نفس الهيكل المؤسسي الذي سيسمح لهم بضمان المجتمع الاستقلال الإحصائي.

ومع ذلك ، فإن الاستخدام غير السليم للمصدر ستكون له نتائج سلبية للغاية على المكاتب الإحصائية ، حيث تعتمد الإحصائيات الرسمية بشكل كبير على سمعتها في تنفيذ مهمتها. ومع ذلك ، يمكننا أن نجادل بأن أهم مهارة يمكن أن تؤدي إلى نتائج غير صحيحة ، إذا تم تفويتها ، هي الاستنتاج الإحصائي ، ولا سيما الاستنتاج القائم على النموذج ، والذي يقل أيضًا احتمال عدم وجوده. لذلك ، سيكون التأثير المتوقع أكثر أهمية (4) من المتطرف.

6.1.4. الوقاية


يمكن للخدمات الإحصائية منع هذا الخطر بنشاط بطريقتين: 1) التدريب. و 2) مجموعة.

يمكن للمكاتب الإحصائية أن تزود الموظفين بالمهارات اللازمة من خلال تحديد المهارات اللازمة لاستخدام مصادر البيانات الكبيرة في الإنتاج الإحصائي بالتفصيل ، وتجميع قائمة بمهارات الموظفين الحالية ، وتحديد الاحتياجات التدريبية ، ثم تنظيم الدورات التدريبية.

يمكن للمكاتب الإحصائية أيضًا تعيين موظفين جدد لديهم المهارات اللازمة. يبدو أن هذا له قيود خطيرة ، حيث أن المكاتب الإحصائية لن تكون قادرة على توظيف كتلة حرجة من الموظفين في حالة يكون فيها استخدام مصادر البيانات الكبيرة منتشرًا في المكتب وسيظل الموظفون الجدد بحاجة إلى عدة سنوات للوصول إلى مستوى خبرة الموظفين الحاليين. ومع ذلك ، قد يكون لدى بعض الموظفين الجدد المعينين على الأقل كجزء من ترقية منتظمة للموظفين مهارات كبيرة في البيانات.

6.1.5. تليين


في مواجهة موقف تتوافر فيه مصادر جديدة للبيانات الضخمة بدون موظفين لديهم المهارات اللازمة ، يمكن للمكاتب الإحصائية التخفيف من الآثار السلبية بطريقتين: 1) التعاقد من الباطن ؛ و 2) التعاون.

يمكن للمكاتب الإحصائية الدخول في اتفاقيات لمعالجة البيانات وتحليل المصادر الجديدة للبيانات الضخمة مع المنظمات الأخرى التي تقدم هذه الأنواع من الخدمات. يبدو أن هذا حل قابل للتطبيق ، حيث يظهر قطاع جديد من الشركات المتخصصة في معالجة هذا النوع من البيانات. ومع ذلك ، هذا قرار يحمل في حد ذاته مخاطر معينة ، حيث سيكون لدى المكتب الإحصائي سيطرة أقل على إنتاج منتجات إحصائية محتملة حساسة. كما أن هذا الحل له عيوب أنه لا يسمح لموظفي المكتب الإحصائي بالتعلم واكتساب المهارات اللازمة.

يبدو التعاون مع المنظمات الأخرى التي لديها موظفين لديهم المهارات اللازمة والذين يرغبون أيضًا في استكشاف مصدر البيانات الضخمة حلًا واعدًا. يمكن أن يتخذ هذا التعاون شكل مشاريع مشتركة مع موظفي المكتب الإحصائي وموظفي المنظمات الأخرى على قدم المساواة ، والذين يشاركون معارفهم. هذا لن يقلل فقط من خطر نقص المهارات ، ولكن سيسمح أيضًا للمكتب الإحصائي باكتساب هذه المهارات.

6.2. تسرب الخبراء للمنظمات الأخرى
6.2.1. وصف


هذا الخطر هو أن الوكالات الإحصائية تفقد موظفيها أمام المنظمات الأخرى بعد أن يكتسبوا مهارات تتعلق بالبيانات الضخمة.

6.2.2. احتمالا


يعتمد احتمال حدوث هذا الخطر على عاملين: 1) الفرص الجذابة الحالية في المنظمات خارج الإحصاءات الرسمية ؛ 2) ظروف العمل في المكاتب الإحصائية.

أما بالنسبة للفرص في المنظمات خارج الإحصاءات الرسمية ، فإن احتمال حدوث هذا الخطر يبدو محتملاً (4). هناك طلب مرتفع على الأشخاص ذوي مهارات البيانات الضخمة في القطاع الخاص ، وكذلك في منظمات القطاع العام الأخرى. بعد اكتساب المهارات في العمل مع البيانات الضخمة ، سيكتسب الإحصائيون الرسميون ميزة نسبية ، كونهم خبراء من ذوي الخبرة في مجال الإحصاء. بالإضافة إلى المهارات المحددة للعمل مع البيانات الضخمة ، تتطلب المنظمات الأخرى متخصصين في البيانات لديهم مهارات أكثر تقليدية ، مثل تقييم احتياجات المستخدم وتطوير مؤشرات الأداء الرئيسية (KPIs) الشائعة للإحصائيين الرسميين. بالإضافة إلى ذلك ، من المتوقع أيضًا أن يكون الموظفون الذين هم أكثر عرضة لتعلم مهارات جديدةالذين سيكونون أيضًا أكثر انفتاحًا على التغييرات المهنية ويغادرون المكتب الإحصائي.

أما بالنسبة لظروف العمل في المكاتب الإحصائية ، فمن الواضح أن هذا سيعتمد بشكل رئيسي على المكتب المعين. ومع ذلك ، لا تزال المكاتب الإحصائية بشكل عام توفر فرصًا مهنية جذابة للأشخاص من وجهة النظر الكمية. تقدم المكاتب الإحصائية أكبر مجموعة من المجالات الممكنة للعمل وأكبر مجموعة من البيانات للعمل. سيقلل هذا بطريقة ما من احتمالية فقدان المكاتب الإحصائية لموظفيها بسبب ظروف غير متوقعة (3).

6.2.3. تأثير


سيكون تأثير هذا الخطر هو نفسه خطر نقص الموظفين ذوي المهارات ذات الصلة في المقام الأول. لذلك ، سيكون التأثير بالغ الأهمية (4) ، كما هو موضح أعلاه.

6.2.4. الوقاية


على ما يبدو ، فإن الطريقة الوحيدة للمكاتب الإحصائية لمنع هذا الخطر هي توفير ظروف عمل جذابة لموظفيها. هذا صحيح بشكل عام لجميع الموظفين. ومع ذلك ، في الحالة المحددة ، عندما يكون الموظفون منفتحين على إتقان مهارات جديدة ، أي مهارات العمل مع البيانات الضخمة ، يمكن تحسين ظروف العمل من خلال تزويدهم بفرص التدريب حيث يمكنهم تطوير اهتماماتهم المهنية. يمكن للمكاتب الإحصائية أيضًا أن تولي اهتمامًا خاصًا للانفتاح على المشاريع والأفكار المبتكرة الجديدة المتعلقة بمصادر البيانات الضخمة الجديدة القادمة من الإحصائيين العاملين في العديد من مجالات الإحصاءات. أخيرا،إن منع فقدان الموظفين للمنظمات الأخرى في تسلسل مهاراتهم في العمل مع البيانات الضخمة سيعتمد على التحديد الجيد للموظفين القادرين والمستعدين للعمل مع هذه البيانات ، وعلى توفير فرص جيدة لتطويرهم المهني.

6.2.5. تليين


سيتم تخفيض هذا الخطر فيما يتعلق بخطر امتلاك الموظف للمهارات المناسبة: 1) التعاقد من الباطن ؛ و 2) التعاون.

7. المناقشة


من هذه المراجعة الأولى ، من الواضح أنه من المستحيل تحديد احتمال أو تأثير واحد لـ "خطر البيانات الضخمة" - كقاعدة ، يعتمد كلا المؤشرين إلى حد كبير على مصدر البيانات الضخمة ، وكذلك على "الإحصاءات الرسمية القائمة على البيانات الضخمة".
المنتج. "

وهكذا ، نستنتج أن الخطوة المنطقية التالية في هذا الاتجاه هي اعتماد عدد من المشاريع التجريبية المحتملة (كل منها يتضمن مجموعة من BDSs واحدة أو أكثر وواحد أو أكثر من BDOSs) كنقطة انطلاق و - لكل مشروع تجريبي - الرغبة في تقييم احتمالية وتأثير كل خطر.

تحقيقا لهذه الغاية ، نحن على وشك إطلاق دراسة استقصائية لأصحاب المصلحة ، محاولين تقييم تقييم OSC لاحتمالية وتأثير (وإجراءات التخفيف / التخفيف المحتملة) لعدد من المشاريع التجريبية المحتملة - وطلب مقترحات OSC للمخاطر التي لم ندرجها في هذه الوثيقة .

8. المراجع
UNECE (2014), «A suggested Framework for the Quality of Big Data», Deliverables of the UNECE Big Data Quality Task Team, www1.unece.org/stat/platform/download/attachments/108102944/Big%20Dat
a%20Quality%20Framework%20-%20final-%20Jan08-2015.pdf?version=1&modificationDate=1420725063663&api=v2

UNECE (2014), «How big is Big Data? Exploring the role of Big Data in Official Statistics», www1.unece.org/stat/platform/download/attachments/99484307/Virtual%20Sprint%20Big%20Data%20paper.docx?version=1&modificationDate=1395217470975&api=v2

Daas, P., S. Ossen, R. Vis-Visschers, and J. Arends-Toth, (2009), Checklist for the Quality evaluation of Administrative Data Sources, Statistics Netherlands, The Hague/Heerlen

Dorfman, Mark S. (2007), Introduction to Risk Management (e ed.), Cambridge, UK, Woodhead-Faulkner, p. 18, ISBN 0-85941-332-22)

Eurostat (2014), «Accreditation procedure for statistical data from non-official sources» in Analysis of Methodologies for using the Internet for the collection of information society and other statistics, www.cros-portal.eu/content/analysismethodologies-using-internet-collection-information-society-and-other-statistics-1

Reimsbach-Kounatze, C. (2015), “The Proliferation of “Big Data” and Implications for Official Statistics and Statistical Agencies: A Preliminary Analysis”, OECD Digital Economy Papers, No. 245, OECD Publishing. dx.doi.org/10.1787/5js7t9wqzvg8-en

Reis, F., Ferreira, P., Perduca, V. (2014) «The use of web activity evidence to increase the timeliness of official statistics indicators», paper presented at IAOS 2014 conference, iaos2014.gso.gov.vn/document/reis1.p1.v1.docx

Even if not explicitly mentioning risks, this paper in fact approaches the many risks associated to the use of web activity data for official statistics. Eurostat (2007), Handbook on Data Quality Assessment Methods and Tools, ec.europa.eu/eurostat/documents/64157/4373903/05-Handbook-ondata-quality-assessment-methods-and-tools.pdf/c8bbb146-4d59-4a69-b7c4-218c43952214


All Articles