هل ستفي البيانات الضخمة بوعودها؟

من المترجم


هذه ترجمة لتقرير كبير الاقتصاديين في بنك إنجلترا عن إمكانيات استخدام البيانات الضخمة في أنشطة هذه المنظمة. العنوان الأصلي "هل ستحافظ البيانات الضخمة على وعدها؟" 30 أبريل 2018.

إنهم يتحدثون كثيرًا عن البيانات الضخمة ، لكنني شخصياً ، غالبًا ما أحصل على انطباع بأننا ، كشعوب أصلية في ملابس خاصة ، نفرض علينا الحلي غير القيمة. يؤكد هذا التقرير ، في رأيي ، أن العمل مع البيانات الضخمة في الواقع عملية معقدة إلى حد ما ، ولكنها مثمرة.

بالطبع ، هذا التقرير مختلف تمامًا عما يخبروننا به ، لأنك تفهم بنفسك أن هذا التقرير مصمم لجمهور مختلف. الجودة ، في رأيي ، مثالية. بشكل عام ، حالة مؤسسة بنك إنجلترا والأخصائي الذي قدم هذه النتائج ، يصبح من الواضح كيف يمكن في كثير من الحالات استخدام تحليل البيانات الضخمة. يمكن صياغة بعض استنتاجاته ، في تركيبات صغيرة ، على النحو التالي:

  • من الضروري للغاية تحديد اتجاه ومستوى تحليل البيانات من خلال مثال على إجراءات البنك السويسري ؛
  • في عدد كبير من الحالات ، قد تظهر القيمة في نتائج جديدة ، على سبيل المثال ، صياغة صياغة وثائق إدارة بنك إنجلترا.

يلمح فقط إلى بعض النتائج عندما يمكن لصناعة الألعاب استبدال طريقة مونت كارلو.

الترجمة الآلية ، مع تصحيحات طفيفة ، حتى لا تقطع الأذن بعد الكاتا.

يسعدني أن أكون هنا لإطلاق مركز أبحاث Data Analytics for Finance and Macro (DAFM) في King's College Business School. أود أن أهنئ الأستاذين جورجيوس كابيتانيوس وجورجيوس كورتارياس ، كمديرين مشاركين (وكذلك زملاء سابقين) ، على تنظيم منصة إطلاق للمركز وإعدادها للإقلاع.

أعتقد أن تطبيق طرق تحليل البيانات لحل العديد من القضايا الملحة في مجال التمويل والاقتصاد الكلي له آفاق كبيرة. لهذا السبب ، أنشأ بنك إنجلترا قبل حوالي أربع سنوات وحدة تحليل البيانات الخاصة به. ولهذا السبب أرحب بشدة بإنشاء هذا المركز الجديد كوسيلة لتحقيق هذا الوعد.

ولكن هل ستفي البيانات الضخمة بوعدها؟ أريد أن أحاول توضيح بعض هذه الوعود بالبيانات الضخمة ، بالإضافة إلى المخاطر المحتملة ، باستخدام أمثلة من الدراسات الأخيرة لبنك إنجلترا على النظام الاقتصادي والمالي. في الختام ، سأقدم بعض الأفكار المضاربة حول البحث المستقبلي حول البيانات الضخمة .1 (1- Cœuré (2017) يقدم ملخصًا ممتازًا لإمكانية البيانات الضخمة لتحسين وضع السياسات ، ولا سيما في البنوك المركزية.)

المسار أقل اتباعا


أول شيء يجب قوله هو أن البيانات الضخمة وطرق تحليل البيانات ليست جديدة. ومع ذلك ، أصبحت في السنوات الأخيرة واحدة من أسرع مناطق النمو نموًا في الأوساط الأكاديمية والتجارية. خلال هذه الفترة ، أصبحت البيانات نفطًا جديدًا. أصبحت طرق تحليل البيانات مصافي تكرير النفط ومصافيها في وقتها ؛ أصبحت شركات المعلومات وعمالقة نفط جديدة .2 (2- على سبيل المثال ، الإيكونوميست (2017) ، Henke et al (2016).)

ومع ذلك ، فقد تم تقييد الاقتصاد والمالية حتى الآن فيما يتعلق بالموافقة العالمية على "حمى النفط". بالنسبة للاقتصاد والتمويل ، كان استخدام طرق تحليل البيانات أقل شيوعًا ، على الأقل مقارنة بالتخصصات الأخرى. يأتي أحد التشخيصات البسيطة في هذا الصدد من النظر في تفسيرات مختلفة تمامًا لتعبير "استخراج البيانات" من قبل أولئك الذين هم داخل وخارج الاقتصاد والمال.

بالنسبة للاقتصاديين ، قلة من الذنوب أكثر إثارة للاشمئزاز من استخراج البيانات. علاج هذا الشرير الأخير هو الانخراط في "مطاردة الانحدار" ، والإبلاغ فقط عن نتائج الانحدار التي تناسب الفرضية التي كان الباحث ينوي اختبارها لأول مرة. هذا هو ما يكمن في الاقتصاد القياسي .3 (3- Leamer 1983) بالنسبة لمعظم الاقتصاديين ، فإن تحليل البيانات هذا له تشابه محزن مع التنقيب عن النفط - أعمال تعدين قذرة يصاحبها تأثير ضار كبير على الصحة.

بالنسبة لعلماء البيانات ، قد يكون الوضع أكثر اختلافًا. بالنسبة لهم ، يعد استخراج البيانات وسيلة لاستخراج موارد قيمة جديدة واستخدامها. هذا يسمح لك بالحصول على أفكار جديدة ، وإنشاء منتجات جديدة ، وإقامة علاقات جديدة ، وتعزيز التقنيات الجديدة. هذه هي المادة الخام لموجة جديدة من الإنتاجية والابتكار ، الثورة الصناعية الرابعة الوليدة .4 (4 - انظر ، على سبيل المثال ، شواب 2017)

ما الذي يفسر تحذير بعض الاقتصاديين من البيانات الضخمة؟ جزء من الإجابة يكمن في المنهجية .5 (5 - Haldane 2016) اتبعت مجموعة لائقة من الاقتصاد خطى منهجية كارل بوبر في الثلاثينيات. دافع بوبر عن نهج استنتاجي للتقدم العلمي .6 (6 - بوبر (1934) و بوبر (1959)) بدأ هذا ببديهيات ، وانتقل من البديهيات إلى النظرية ، وبعد ذلك فقط قبلت الفرضيات للبيانات. وبعبارة أخرى ، سبقت النظرية القياس.

هناك نهج بديل استقرائي. هذا له جذور أعمق في عمل فرانسيس بيكون من أوائل القرن السابع عشر .7 (7 - بيكون 1620) يبدأ ببيانات غير مقيدة بالبديهيات والفرضيات ، ثم يستخدمها لإبلاغ اختيار السلوكيات. وبعبارة أخرى ، تسبق البيانات النظرية. في الواقع ، اقترح بعض الباحثين في البيانات أن مثل هذا النهج يمكن أن يشير إلى "نهاية النظرية". 8 (8 - Anderson 2008)

لذلك ، حيث يميل بعض الاقتصاديين إلى رؤية المزالق في البيانات الكبيرة ، يرى خبراء البيانات آفاقًا واعدة. حيث يميل بعض الاقتصاديين إلى رؤية التهديد البيئي الذي يشكله ، يرى محللو البيانات الإمكانات الاقتصادية. أنا كاريكاتير قليلاً ، لكن قليلاً فقط. فمن هو الحق؟ وهل يشير عصر البيانات الضخمة إلى تدفق النفط أو تسرب النفط؟

صحيح ، كما يحدث غالبًا ، ربما يقع في مكان ما في المنتصف. يمكن أن يقدم كل من النهج الاستنباطي والاستقرائي نظرة ثاقبة للعالم. تعتبر أفضل الإضافات المنهجية من البدائل. وبعبارة أخرى ، فإن استخدام نهج واحد في العزلة يزيد من خطر الاستنتاجات الخاطئة والأخطاء الخطيرة المحتملة في الفهم والسياسة. دعني أعطيك بعض الأمثلة لتوضيح.

خلال الأزمة المالية العالمية ، أصبح من المقبول الآن تمامًا أن نموذج التوازن العام العشوائي الديناميكي (DSGE) من العمود الفقري الرئيسي للاقتصاد الكلي سقط على السور الأول .9 (9 - على سبيل المثال ، Stiglitz 2018) لم تستطع شرح ديناميكيات دورة الأعمال خلال أو بعد الأزمة. على الرغم من أنها نقية من الناحية النظرية ، إلا أنها اتضح أنها هشة تجريبياً. أعتقد أن هذه الهشاشة التجريبية نشأت بسبب الاعتماد المنهجي المفرط على الأساليب الاستنتاجية. أو بعبارة أخرى ، يرجع ذلك إلى حقيقة أن القليل من الاهتمام يتم إعطاؤه للبيانات الحقيقية للماضي ، بما في ذلك الأزمات.

كمثال مضاد ، أطلقت Google في عام 2008 نموذجًا تنبؤيًا لتفشي الإنفلونزا استنادًا إلى عبارات مثل "علامات الإنفلونزا". 10 (10 - Ginsberg et al 2009) وقد أدى هذا عملًا هائلًا في تتبع تفشي الإنفلونزا في الولايات المتحدة في 2009-2010. ولكن في السنوات التالية ، عانت تنبؤات هذا النموذج من هزيمة ساحقة .11 (11 - Lazer et al 2014) أود أن أقترح أن هذه الهشاشة التجريبية نشأت بسبب الاعتماد المفرط على القوانين التجريبية والالتزام المفرط بالأساليب الاستقرائية. أو بعبارة أخرى ، قلة الاهتمام بالأسباب الطبية العميقة لتفشي الإنفلونزا في الماضي.

في الحالة الأولى ، نشأت الهشاشة التجريبية بسبب مجموعة من البديهيات والقيود الضيقة للغاية ، بسبب التركيز المفرط على النظرية ، وليس على الارتباطات الحقيقية والخبرة التاريخية. في الحالة الثانية ، نشأت الهشاشة التجريبية بسبب مجموعة ضعيفة جدًا من البديهيات والقيود بسبب الارتباطات التجريبية الملحوظة ، والتي تلعب دورًا كبيرًا جدًا فيما يتعلق بالنظرية والسببية.

في كلتا الحالتين ، يمكن تقليل هذه الأخطاء إذا تم استخدام النهج الاستقرائي والاستنباطي بطريقة تكميلية أو تكرارية. هذا النهج التكراري له أصل قوي في التخصصات الأخرى. تضمن تاريخ التقدم في العديد من التخصصات العلمية عملية تعلم ذات اتجاهين بين النظرية والتجريبية ، عندما حفزت النظرية في بعض الحالات القياسات وفي حالات أخرى نظرية دافع القياس في حلقة تغذية مرتدة مستمرة .12 (12 - بيكون (1620) يلخص هذا جيدًا: الذين تعاملوا مع العلوم هم إما رجال تجريب أو رجال عقائد. رجال التجربة هم مثل النملة ، فهم يجمعون ويستخدمون فقط ؛ المنطقون يشبهون العناكب ، الذين يصنعون العنكبوت من مادتهم الخاصة. لكن النحلة تأخذ وسطًا بالطبع: يجمع مواده من أزهار الحديقة والميدان ،ولكن يحولها ويهضمها بقوة خاصة بها. ")

أحد الأمثلة على هذا النهج ، الذي ناقشه الحاكم كارني أثناء إطلاق برنامج تحليل البيانات الخاص به للبنك ، يتعلق بديناميكيات حركة الكواكب. (13 - كارني 2015) كان السير إسحاق نيوتن (المالك السابق للسك الملكي الذي طبع النقود أيضًا) هو الذي طور النظرية الفيزيائية للحركة السماوية. لكن هذه النظرية بنيت على الكتفين التجريبيين لعملاق علمي آخر ، يوهانس كيبلر. عندما يتعلق الأمر بالحركة الكوكبية ، قادت التجريبية أولاً النظرية ، وأدت الحث الاستنباطي.

كان الأمر نفسه من وقت لآخر عندما فهمنا حركة الاقتصاد والأسواق المالية. بنيت النظريات الكينزية والنقدية على الخبرة التجريبية من وقت الكساد الكبير. نشأ منحنى Phillips كقانون Kepler تجريبي ، والذي تلقى لاحقًا أساسًا نظريًا لنيوتن. بدأت العديد من الألغاز المالية التي طاردها المنظرون منذ عقود باعتبارها حالات شاذة تجريبية في أسواق الأصول .14 (14 - Obstfeld and Rogoff (2001) يناقشون ستة ألغاز رئيسية في الاقتصاد الكلي الدولي ، مثل التقلبات المفرطة في أسعار الصرف بالنسبة للأساسيات.) في كل حالة ، قادت التجريبية التجريبية النظرية ، وقادت الاستقرائي الاستنتاجي.

استنتاجي من كل هذا واضح. إذا كانت عملية التعلم التكرارية هذه بين التجريبية والنظرية ستستمر في أن تؤتي ثمارها في الاقتصاد ، فقد تتطلب المناهج الاستنتاجية والاستقرائية فوترة متساوية بشكل عام. إذا كان الأمر كذلك ، فأعتقد أن الاقتصاد والتمويل سيحصلان على عائد مرتفع من خلال القيام بمزيد من الاستثمارات الفكرية في البيانات الضخمة ومرافقتها بأساليب تحليلية في المستقبل.

تعريف البيانات الضخمة


إذا كانت البيانات الكبيرة واعدة ، فربما يكون من المفيد البدء بتحديدها. هذا ليس سهلا. مثل الجمال ، ما يعتبر بيانات كبيرة في نظر الناظر. وهو أيضًا مفهوم مرن. على سبيل المثال ، من الواضح أن البيانات لم تعد تعني الأرقام والكلمات فقط. في الواقع ، في السنوات الأخيرة كانت هناك زيادة في البحث في علم الدلالات ، بما في ذلك في مجال الاقتصاد والتمويل.

ما هو أقل إثارة للجدل هو أنه على مدى العقد الماضي ، حدثت أكثر ثورة استثنائية في إنشاء البيانات واستخراجها وجمعها ، بالمعنى الواسع للكلمة. كان هذا جزئياً نتيجة لقانون مور وما يتصل به من تقدم في تكنولوجيا المعلومات. 15 (15 - مور (1965) أشار إلى المضاعفة السنوية في عدد المكونات لكل دائرة متكاملة) على عكس النفط ، الذي تكون موارده محدودة ، يتم إنشاء بيانات جديدة باستخدام سرعة غير مسبوقة ولديها احتياطيات غير محدودة تقريبا.

تشير التقديرات إلى أن 90٪ من جميع البيانات التي تم إنشاؤها على الإطلاق كانت في العامين الماضيين .16 (16 - SINTEF 2013) جزء جيد من الشبكات الاجتماعية. يستخدم حوالي 1.5 مليار شخص Facebook يوميًا و 2.2 مليار شهريًا. في عام 2017 ، كان هناك 4.4 مليار اشتراك في الهواتف الذكية ، أكثر من اشتراك لكل شخص آخر على هذا الكوكب. وفقًا للتنبؤات ، بحلول عام 2023 ، سيصل عدد مشتركي الهواتف الذكية إلى 7.3 مليار ، أي ما يقرب من واحد لكل شخص .17 (17 - تقرير Ericsson Mobility 2017 2017) وفقًا للتقديرات ، في عام 2017 ، تم التقاط 1.2 تريليون صورة ، وهو 25 ٪ من جميع الصور الملتقطة على الإطلاق 18 (18 - راجع www.statista.com/chart/10913/number-of-photos-taken-worldwide )

تنفتح وجهة نظر أخرى لثورة المعلومات هذه عندما ننظر إلى عدد العلماء الذين يدرسون البيانات. باستخدام بيانات الوظيفة من موقع Reed للبحث عن الوظائف ، تم نشر أكثر من 300 إعلان وظيفة في المملكة المتحدة مؤخرًا لمحترفي معالجة البيانات .19 (19 - استخدام مجموعة البيانات في Turrell et al (قريبًا)) لم يكن هناك أي شيء تقريبًا في عام 2012. تشير التقديرات المستندة إلى التعريف الذاتي على موقع الشبكات الاجتماعية المترابطة إلى أنه يمكن أن يكون هناك أكثر من 20000 متخصص في معالجة البيانات في العالم .20 (20 - Dwoskin (2015). العدد الحقيقي لعلماء البيانات في جميع أنحاء العالم غير مؤكد إلى حد كبير. العديد من الأفراد العمل على علوم البيانات دون استخدام المسمى الوظيفي بالضرورة ، ولكن العكس صحيح أيضًا.)

في الوقت نفسه ، كان هناك نمو سريع في الطرق الجديدة لمعالجة المعلومات وتصفيتها واستخراجها من هذه البيانات. تتطور تقنيات التعلم الآلي بسرعة. إن ما يسمى بأساليب "التعلم العميق" تكمل المناهج الحالية ، مثل النماذج القائمة على الأشجار ، وآلات المتجهات الداعمة ، وآلات المتجه وتقنيات التجميع .21 المسافات والتحليل الدلالي .22 (22 - Bholat et al 2015)

تقدم كل هذه الأساليب طرقًا مختلفة لاستخراج المعلومات والحصول على استنتاجات موثوقة في المواقف التي يمكن أن تكون فيها العلاقات التجريبية معقدة وغير خطية ومتطورة وعندما تصل البيانات إلى ترددات مختلفة وبأشكال مختلفة. تختلف هذه المناهج اختلافًا كبيرًا عن الأساليب الاقتصادية القياسية للاستدلال والاختبار ، وغالبًا ما تستخدم في الاقتصاد والتمويل.

هذه الثورة في عرض البيانات وطرق فهمها تقدم ثروة تحليلية. ومع ذلك ، يتطلب استخراج هذه الثروات توخي الحذر الشديد. على سبيل المثال ، تلوح مشكلات خصوصية البيانات بشكل أوسع مع البيانات الدقيقة ، في بعض الحالات الشخصية. في الآونة الأخيرة ، احتلت هذه القضايا مكانًا بارزًا بحق. وفي الوقت نفسه ، تعد حماية البيانات الضخمة إحدى المهام الرئيسية للبنك في بحثه.

وعد البيانات الكبيرة


إلى الحد الذي يمكن فيه وصف البيانات الضخمة ، يتم ذلك عادةً باستخدام "ثلاثة Vs": الحجم والسرعة والتنوع. باستخدام ثلاثة Vs كهيكل تنظيمي ، اسمحوا لي أن أناقش بعض الأمثلة لكيفية استخدام هذه البيانات والأساليب في البحوث المصرفية الأخيرة لتحسين فهمنا لسير الاقتصاد والنظام المالي.

الصوت


الأساس الإحصائي لتحليل الاقتصاد الكلي ، على الأقل منذ منتصف القرن العشرين ، هو الحسابات القومية. تعتمد الحسابات القومية دائمًا على مجموعة بيانات انتقائية .23 (23 - Coyle 2014) في الماضي ، كانت حسابات استخدام الأراضي والمحاصيل والثروة الحيوانية لتقدير الإنتاج الزراعي. تم قياس الإنتاج الصناعي بمصادر مختلفة مثل عدد أفران الحديد والكتب المدرجة في المكتبة البريطانية. وقدر ناتج الخدمات على أساس حمولة الأسطول التجاري .24 (24 - فوكيه وبرودبيري 2015)

مع وصول المزيد من البيانات أكثر من أي وقت مضى ، أصبح استخدام مصادر البيانات الجديدة والانتقائية وأساليبها أكثر شيوعًا في المكاتب الإحصائية. في مجال قياس أسعار المستهلكين ، يستخدم مشروع أسعار MIT Billion البيانات من أكثر من 1000 متجر على الإنترنت في حوالي 60 دولة لجمع 15 مليون سعر على أساس يومي. تم العثور على هذا النهج لتوفير معلومات أسعار المستهلك (وأرخص) في الوقت المناسب أكثر من المسوحات التقليدية .25 (25 - Cavallo و Rigobon 2016) وقد وجد أيضًا أن بيانات الأسعار عبر الإنترنت تعمل على تحسين توقعات التضخم على المدى القصير في بعض الأسواق. (26 - كوري 2017)

ومن نفس المنطلق ، يقوم مكتب المملكة المتحدة للإحصاءات الوطنية (ONS) باستكشاف إمكانية استخدام "تجريف الويب" بالإضافة إلى طرق التسعير الحالية. اليوم ، يركزون على عناصر مثل الطعام والملابس. على الرغم من السنوات الأولى ، تبدو الفوائد المحتملة من حيث زيادة أحجام العينات ودقة التفاصيل كبيرة. على سبيل المثال ، جمع ONS حتى الآن 7000 عرض سعر في اليوم لمجموعة من منتجات البقالة ، وهو ما يزيد عن الرسوم الشهرية الحالية لهذه المنتجات في مؤشر أسعار المستهلك .27 (27 - راجع www.ons.gov.uk/economy/inflationandpriceindices/articles/researchindicesusingwebscrapedpricedata / أغسطس 2017 تحديث )

فيما يتعلق بقياس الناتج المحلي الإجمالي ، تظهر هنا مصادر وطرق جديدة. استخدمت إحدى الدراسات الحديثة صور الأقمار الصناعية لقياس مقدار الضوء غير الطبيعي المنبعث من مناطق مختلفة من العالم. وقد وجد أن هذا له علاقة ذات دلالة إحصائية بالنشاط الاقتصادي .28 (28 - هندرسون ، ستوريجارد وويل (2011) ، يمكن أن يساعد هذا النهج في تتبع الأنشطة في المناطق التي تمت إزالتها جغرافيًا ، حيث طرق المسح الإحصائي ضعيفة أو حيث المشاكل غير صحيحة القياسات حادة.

من الأمثلة الأكثر دنيوية التي يستخدمها مكتب الإحصاءات الوطنية في بريطانيا العظمى والوكالات الإحصائية الأخرى ما يسمى بالبيانات الإدارية. وهذا يشمل البيانات التي تم جمعها من قبل الوكالات الحكومية كجزء من أنشطتها - على سبيل المثال ، على عائدات الضرائب والمزايا. في المملكة المتحدة ، أصبحت بعض هذه البيانات متاحة مؤخرًا للاستخدام على نطاق أوسع كجزء من مبادرة حكومية للبيانات المفتوحة ، على الرغم من أنها خضعت للتحقق الجاد.

ومن الأمثلة على ذلك بيانات ضريبة القيمة المضافة التي تم تلقيها من الشركات الصغيرة والمتوسطة في عدد من الصناعات التي تم استخدامها مؤخرًا من قبل مكتب الإحصاءات الوطنية لتجميع تقديرات الناتج المحلي الإجمالي بناءً على الناتج. كما هو الحال مع الأسعار ، فإن الزيادة في حجم العينة ودقة التفاصيل من استخدام مثل هذه البيانات الإدارية قد تكون كبيرة. تستند المراجعة الشهرية لنشاط أعمال ONS ​​، كقاعدة ، على عينة من حوالي 8000 شركة تمثل هذه المجموعة الفرعية من الشركات الصغيرة والمتوسطة. يتم استكمال ذلك حاليًا بإرجاع ضريبة القيمة المضافة لحوالي 630.000 وحدة إبلاغ .29 (29 - www.ons.gov.uk/economy/grossdomesticproductgdp/articles/vatturnoverinitialresearchanalysisuk/december )

هذه البيانات الجديدة تكمل ، وليس تحل محل ، طرق المسح الحالية. لديهم القدرة على تحسين توقيت ودقة بيانات الحسابات القومية بشأن الاتجاهات الاقتصادية الإجمالية. لدى ONS مركز علوم البيانات الخاص بها لقيادة هذا الجهد. وتقوم منظمات بحثية جديدة ، مثل معهد آلان تورينج ، بعمل ممتاز بتطبيق بيانات وطرق جديدة للأبعاد الاقتصادية.

البيانات المالية من المجالات الأخرى التي يمكن أن تكون مثمرة في تتبع تدفقات الأنشطة في الاقتصاد. تقريبا كل النشاط الاقتصادي يترك علامة مالية على الميزانية العمومية لمؤسسة مالية. يمكن أن يساعد تتبع التدفقات النقدية بين المؤسسات المالية في تحديد حجم هذه البصمة ، وبالتالي ، بشكل غير مباشر ، لتتبع النشاط الاقتصادي.

على مدى السنوات القليلة الماضية ، اعتمدنا في البنك على قاعدة بيانات مبيعات منتجات مكتب التنظيم والإشراف المالي (PSD). هذا مصدر مفصل للغاية للبيانات الإدارية حول منتجات الرهن العقاري للمستأجر ، الصادرة في المملكة المتحدة. أنه يحتوي على بيانات حول ما يقرب من 16 مليون قرض عقاري منذ منتصف عام 2005. قدم PSPS للبنك أداة جديدة عالية الدقة لتحليل سلوك الأسرة والإسكان.

على سبيل المثال ، في عام 2014 ، تم استخدام PSD من قبل لجنة السياسة المالية بالبنك لإبلاغ ومعايرة قراراتها بشأن القيود الاحترازية الكلية على الرهون العقارية عالية الدخل للأسر في المملكة المتحدة .30 (30 - يونيو 2014 تقرير الاستقرار المالي) منذ ذلك الحين ، قمنا استخدمت هذه البيانات لتتبع خصائص القروض العقارية الحالية ذات الدخل المرتفع على القروض والقروض المرتفعة بتكلفة بمرور الوقت .31 (31 - Chakraborty و Gimpelewicz و Uluc 2017) تم استخدام بيانات PSD لفهم قرارات التسعير في سوق الإسكان في المملكة المتحدة .32 (32 - Bracke and Tenreyro (2016) و Benetton و Bracke and Garbarino (2018)) كما تم استخدامها لمعايرة نموذج الوكيل متعدد الصناعات في المملكة المتحدة لسوق الإسكان .33 (33- Baptista et al 2016).

في السنوات الأخيرة ، طور البنك و ONS مجموعة أكثر اكتمالاً من البيانات حول تدفقات الأموال بين المؤسسات. ومن المؤمل أن تساعد هذه البيانات ليس فقط على تتبع تغيرات المحفظة ، ولكن أيضًا كيف يمكن أن تؤثر على الأسواق المالية والاقتصاد ككل. على سبيل المثال ، هل تؤثر عمليات إعادة توزيع المحفظة من قبل المستثمرين المؤسسيين على أسواق الأصول وهل لها تأثير محفز على الإنفاق؟ 34 (34 - بنك إنجلترا ومجموعة عمل Procyclicality 2014) تساعد الإجابات على هذه الأسئلة ، على سبيل المثال ، في تقييم فعالية التيسير الكمي .35 (35 - على سبيل المثال ، يعرض ألبرتازي وبيكر وبوسنها (2018) أدلة على قناة إعادة موازنة المحفظة من برنامج شراء الأصول التابع للبنك المركزي الأوروبي)

كما يتم تغذية البيانات الجديدة والمفصلة للغاية إلى عمليات الدفع والائتمان والتدفقات المصرفية. تم استخدام بعضها للتنبؤ أو تتبع التغيرات في النشاط الاقتصادي. لقد حققوا بعض النجاح. على سبيل المثال ، في الولايات المتحدة ، تم استخدام مجموعة بيانات لأكثر من 12 مليار معاملة بطاقة ائتمان وخصم على مدى 34 شهرًا مؤخرًا لتحليل أنماط الاستهلاك حسب العمر وحجم الشركة والمنطقة الحضرية والقطاع .36 (36 - Farrell and Wheat 2015 )

بمرور الوقت ، ربما تساعد هذه الأنواع من البيانات في إنشاء خريطة لتدفقات الأنشطة المالية وفي الوقت الفعلي عبر الاقتصاد ، بنفس الطريقة التي يتم بها بالفعل لحركة المرور أو المعلومات أو تدفقات الطقس. بعد أن يتم تعيينها ، سيكون من الممكن نمذجة وتعديل هذه التدفقات باستخدام سياسة. لقد تحدثت لأول مرة عن هذه الفكرة قبل ست سنوات. واليوم يبدو أقرب من أي وقت مضى إلى أن يكون في متناول أيدينا .37 (37 - علي وهالداني وناهاي ويليامسون 2012)

هذه كلها مجالات حيث يمكن لـ DAFM تقديم مساهمة مهمة في الجهود المبذولة لتحسين جودة وتوقيت بيانات الاقتصاد الكلي وبيانات النظام المالي. من المعروف جيدًا أن فرص تحسين جودة بيانات الحسابات القومية كبيرة جدًا .38 (38 - على سبيل المثال ، Bean 2016) وستزداد مشكلات القياس هذه مع تقدمنا ​​نحو اقتصاد رقمي وموجّه نحو الخدمة بشكل متزايد.

سرعة


الجانب الثاني لثورة البيانات الكبيرة هو تواترها وحسن توقيتها. قد توفر البيانات الأكثر تكرارا صورة جديدة أو أكثر دقة للاتجاهات في الأسواق المالية والاقتصاد. يمكن أن يساعد أيضًا في بعض الأحيان في حل مشكلات تحديد معقدة تتعارض مع كل من البيانات الضخمة (كما هو موضح في مثال الإنفلونزا من Google) وطرق الاقتصاد القياسي التقليدية (كما أظهر مثال DSGE).

وقد أظهرت الأزمة أنه في المواقف العصيبة ، قد تفتقر بعض أكبر وأعمق الأسواق المالية في العالم إلى السيولة. وقد أدى ذلك إلى الاستيلاء على بعض هذه الأسواق. رداً على ذلك ، كواحد من أولى أعمالها ، وافقت مجموعة العشرين في عام 2009 على جمع المزيد من البيانات حول المعاملات في هذه الأسواق للمساعدة على فهم ديناميكياتها بشكل أفضل في المواقف العصيبة .39 (39 - انظر ، على سبيل المثال ، FSB 2010 ) يتم تخزين هذه البيانات في مستودعات التداول.

في السنوات الأخيرة ، بدأت مستودعات التداول هذه في جمع البيانات على أساس تجاري مفصل للغاية. وهذا يعني أنها جمعت بسرعة كمية كبيرة من البيانات. على سبيل المثال ، يتم جمع حوالي 11 مليون تقرير كل يوم عمل في سوق الصرف الأجنبي. توفر مصدرًا غنيًا للبيانات عندما يتعلق الأمر بديناميكيات ومواقع السوق المالية عالية التردد.

أحد الأمثلة على مثل هذا التحيز حدث عندما تم فك ربط الفرنك السويسري في يناير 2015. تسببت هذه الخطوة غير المتوقعة في حدوث تحولات كبيرة في أسعار الأصول. أظهر فرانك حركة حادة على شكل حرف V لعدة ساعات مباشرة بعد فك الارتباط. من خلال تحليل بيانات المستودعات التجارية حول العقود الآجلة بالفرنك السويسري إلى أسعار اليورو ، يمكن تحديد بعض القوى الدافعة وراء هذه التغييرات .40 (40 - Cielinska et al (2017). وتشمل الأوراق البحثية الحديثة الأخرى التي تستخدم بيانات المستودعات التجارية Abad et al (2016 ) و Bonollo et al (2016))

على سبيل المثال ، يمكن مقارنة التقلبات عالية التردد في العملة السويسرية بحجم التداول في العقود الآجلة. يمكن أن تتحلل هذه المعاملات أكثر من قبل الأطراف المقابلة ، على سبيل المثال ، البنوك الكبيرة المتعاملين والمستثمرين النهائيين. يوضح هذا النوع من طريقة التحلل أنه كان سحب السيولة من قبل البنوك الكبيرة - التجار الذين تسببوا في تجاوز فرانك - علامة كلاسيكية في أوقات اضطراب السوق .41 (41 - انظر ، على سبيل المثال ، Duffie ، Gârleanu و Pedersen (2005) و Lagos ، Rocheteau and Weill (2011 )) انعكست هذه الحركة جزئيًا بمجرد استئناف المتداولين إنتاج السوق.

يمكن أيضًا استخدام بيانات المستودعات التجارية لتقييم ما إذا كان لربط الفرنك الضعيف أي تأثير دائم على أداء السوق. وأظهرت دراسة أجراها البنك أن الأمر كذلك ، مع تجزئة مستمرة في سوق الفرنكات الآجلة. كانت السيولة والنشاط بين الوكلاء أقل من الناحية الهيكلية ، وكان تقلب السوق أعلى بثبات بعد هذه الحلقة.

يسمح لنا التحسين الإضافي لهذه البيانات برواية قصة شبه سببية عن القوى الدافعة للحركة على شكل حرف V في أسواق الأصول بعد فك الارتباط. يسمح لك استخدام البيانات المتوازية مع كل قطعة على حدة والمتاجرة بالتعرف على المشغلات ومكبرات الصوت بطريقة تكون مستحيلة.

المثال الثاني على دراسة تستخدم بيانات أسرع لتحسين فهمنا للديناميكيات الاقتصادية هو سوق العمل. يظل فهم السلوك المشترك للعمالة والأجور أحد القضايا المركزية للاقتصاد الكلي الحديث. في الآونة الأخيرة ، كانت هذه الديناميكيات معقدة بسبب التغيرات في عالم العمل ، عندما تغير الأتمتة طبيعة وهيكل العمل.

استخدمت البحوث المصرفية الأخيرة بيانات تفصيلية عن الوظائف الشاغرة المعلنة لإلقاء الضوء على هذه الديناميكية .42 (42 - Turrell et al (قريباً)) تحلل الدراسة حوالي 15 مليون وظيفة شاغرة على مدى عشر سنوات. بدلاً من تصنيف الوظائف الشاغرة حسب القطاع أو الوظيفة أو المنطقة ، يستخدم أساليب التعلم الآلي في نص وصف الوظيفة لتصنيف الوظائف الشاغرة وتجميعها. والنتيجة هي مخطط تصنيف "وصف الوظيفة" للطلب على العمالة.

يوفر هذا النهج طريقة مختلفة لتصنيف ووصف كيفية تطور عالم العمل - على سبيل المثال ، أنواع المهارات اللازمة في بيئة الأتمتة. كان مخطط التصنيف مفيدًا أيضًا في تحديد العلاقة بين الطلب على العمل والأجور. يساعد استخدام التصنيفات القائمة على الأوصاف الوظيفية في تحديد علاقة أوضح بين الطلب على العمالة والأجور المعروضة والمتفق عليها.
تنوع

يعتبر استخدام الكلمات وليس الأرقام كبيانات من المجالات الأكثر إنتاجية في مجال أبحاث البيانات الضخمة في القطاعات الكلية والمالية. البيانات الدلالية وطرق البحث الدلالية لها نسب غنية في العلوم الاجتماعية الأخرى ، مثل علم الاجتماع وعلم النفس. ولكن حتى الآن ، كان استخدامها في الاقتصاد والتمويل محدودًا نسبيًا .43 (43 - من الأمثلة البارزة تشمل Schonhardt-Bailey (2013) و Goldsmith-Pinkham ، Hirtle and Lucca (2016))

مثل العلوم الاجتماعية الأخرى ، يرتبط الاقتصاد والتمويل بـ الاختيار البشري. ونحن نعلم أن الناس غالبًا ما يعتمدون على الاستدلال أو القصص ، بدلاً من الإحصائيات ، عندما يفهمون العالم ويتخذون القرارات. وبالتالي ، فإن الإدراك الدلالي لهذه القصص مهم لفهم السلوك البشري واتخاذ القرارات.

على سبيل المثال ، بدأ البنك مؤخرًا في تعلم اللغة التي يستخدمها في الاتصالات الخارجية ، سواء مع الشركات المالية أو عامة الناس. على سبيل المثال ، أنا ومايكل مكماهون من جامعة أكسفورد ، قدّرنا مؤخرًا كيف أدى تبسيط صياغة لجنة السياسة النقدية (MPC) في تقرير التضخم في أواخر العام الماضي إلى زيادة الوعي العام برسائل السياسة النقدية .44 (44 - هالدان و مكماهون (قادم)).

يفحص المثال الثاني جانبًا أقل درسًا في عملية صنع القرار المصرفي - إشرافه على الشركات المالية .45 (45 - Bholat et al 2017) ويستند هذا إلى تحليل نصي لاجتماعات الملخص الدوري السرية للبنك (PSMs) المرسلة إلى الشركات المالية. ربما تكون هذه هي الرسائل الوحيدة الأكثر أهمية التي ترسلها السلطة التنظيمية التحوطية (PRA) بانتظام إلى الشركات ، وتضع تقييمًا لمخاطر الشركات من قبل المشرفين وتتطلب اتخاذ إجراءات للتخفيف من تلك المخاطر. باستخدام طريقة التعلم الآلي تسمى الغابات العشوائية ، يقوم الباحثون بتحليل هذه الحروف واستخراج البيانات حول نبرتها ومحتواها.

يحتوي هذا النوع من التحليل على عدد من تطبيقات السياسة. يمكن استخدامه لتقييم ما إذا كانت الرسائل ترسل رسالة إشرافية واضحة ومتسقة للشركات. على سبيل المثال ، يمكنك مقارنة قوة ومحتوى هذه الرسائل مع التقييم الداخلي للبنك لنقاط القوة والضعف في الشركات. هل يتوافق هذان النهجان مع نظام الرقابة في البنك؟ بشكل عام ، أظهرت الدراسات أنها كذلك.

يمكن استخدام هذا النهج أيضًا لتقييم كيفية تطور نمط المراقبة بمرور الوقت. على سبيل المثال ، كيف تغيرت منذ التحول في النماذج الإشرافية من إدارة الخدمات المالية (FSA) إلى PRA؟ وأظهرت الدراسة أنه ، مقارنة مع هذين الوضعين ، أصبح تبادل الرسائل الإشرافية أكثر واعدة وشكلية وذات مغزى ، وهو ما يتفق مع النموذج الجديد للأنشطة الإشرافية لـ PRA.

أعتقد أن هذا التمرين هو مثال جيد لتطبيق منهجية جديدة (غابات عشوائية) على قاعدة بيانات جديدة تمامًا (التقييمات الإشرافية المصرفية) في مجال السياسة ، والتي لم يدرسها الباحثون من قبل (إشراف الشركات المالية). وقد توصل إلى استنتاجات تتعلق مباشرة بقضايا السياسة. لذا ، أعتقد أنها تؤكد بشكل جميل على آفاق البيانات الضخمة.

في المثال الأخير ، لم يتم استخدام البيانات الجديدة ، ولكن القديمة. ومع ذلك ، أعتقد أن هذا مثال جيد على كيفية استخدام الأساليب الجديدة أيضًا لفهم الماضي. قبل وقت طويل من أن يصبح البنك مسؤولاً عن السياسة النقدية والاستقرار المالي ، كان أحد الأدوار الرئيسية للبنك هو تقديم القروض ، كملاذ أخير ، للبنوك التجارية التي تعاني من ضغط السيولة.

من الصعب تحديد التاريخ بدقة ، لكن البنك بدأ في إجراء مثل هذه العمليات بجدية ، ربما في الوقت الذي واجهت فيه بريطانيا العظمى سلسلة مستمرة من الذعر المصرفي في أعوام 1847 و 1857 و 1866. رد البنك على هذا الذعر بتوفير السيولة لدعم البنوك. ظهرت آخر تسهيلات ائتمانية ، حيث بدأ Badgehot فيما بعد في تسميتها. 46 (46 - Bagehot 1873) في الواقع ، في وقت لاحق ، حدد Beydzhhot مبادئ هذا الإقراض: يجب أن يحدث بحرية ، مع عقوبة مقابل ضمانات جيدة.

السؤال التاريخي المثير للاهتمام المتعلق اليوم هو ما إذا كان البنك قد التزم حقًا بهذه المبادئ عند الإقراض إلى الملاذ الأخير خلال ذعر 1847 و 1857 و 1866. لتقييم هذا ، أخذنا بيانات من الكتب الورقية الضخمة التي تسجل التغييرات في الميزانية العمومية للبنك ، حيث تم تسجيل هذه التدخلات على الائتمان للقرض ، والطرف المقابل للطرف المقابل ، وسعر الفائدة لسعر الفائدة .47 (47 - Anson et al 2017)

كان فك شفرة هذه البيانات مفيدًا من حيث أن الملاحظات المكتوبة بخط اليد في الكتب قام بها عدد صغير من الكتبة خلال الأزمات الثلاث - وهي إحدى المزايا غير المباشرة لاستمرارية الأعمال. بينما تم تسجيل البيانات يدويًا بشكل أساسي ، طور المشروع نظامًا للتعرف على الصور باستخدام خوارزمية الشبكة العصبية ، والتي سنستخدمها في المستقبل لتحويل عمليات الكتب التاريخية إلى بيانات قابلة للقراءة آليًا للقرن الحادي والعشرين.

البيانات المتعلقة بالإقراض التاريخي إلى الملاذ الأخير للبنك هي بيانات جديدة ومفصلة للغاية وكبيرة من حقبة ماضية. وهذا يدل على أن نهج البنك في الإقراض في الحالات القصوى قد تغير بشكل كبير خلال أزمات منتصف القرن التاسع عشر. وهذا يعني أنه بحلول أزمة عام 1866 ، اتبع البنك بشكل أو بآخر مبادئ الإقراض كملاذ أخير ، تم تحديده لاحقًا بواسطة Badgehot. هذا مثال آخر على قيادة النظرية التجريبية.

يتم تطبيق أساليب التعلم الآلي على الإحصائيات التي يتم جمعها والإبلاغ عنها بانتظام من قبل البنك. على وجه الخصوص ، يتم استخدام هذه الطرق لتحديد الأخطاء أو الشذوذ في بيانات المصدر المقدمة إلى البنك. وهذا يجعل تنظيف البيانات أكثر منهجية وفعالية من العمليات اليدوية. يمكن أيضًا استخدام طرق تحليل البيانات لمقارنة مصادر جديدة للبيانات الدقيقة. لا يوفر هذا طريقة أخرى للتحقق من صحة البيانات فحسب ، بل يمكن أيضًا أن يعطي فكرة أنه لا يمكن الكشف عن مصادر البيانات الفردية بمفردها. 48 (48 - Bahaj ، Foulis and Pinter (2017) ، على سبيل المثال ، تطابق على مستوى الشركة البيانات المحاسبيةبيانات أسعار المنازل على مستوى المعاملات وبيانات الرهن العقاري السكنية على مستوى القروض لتوضيح كيف يمكن أن يؤثر سعر منزل مدير الشركات الصغيرة والمتوسطة على فاتورة الاستثمار والأجور لشركاتهم.) في بنك إنجلترا ، كما هو الحال في أماكن أخرى ، فإن الروبوتات في ارتفاع.

نظرة إلى المستقبل


بالنظر إلى المستقبل ، يمكن ملاحظة أن هناك العديد من المجالات المحتملة التي يمكن من خلالها توسيع هذه المصادر الجديدة والأساليب الجديدة لتحسين فهم البنك للنظام الاقتصادي والمالي. من قائمة طويلة ، دعوني أناقش واحدة تبدو لي ذات أهمية خاصة.

لقد حقّق الاقتصاد السلوكي ، بشكل صحيح ، ضجة كبيرة على مدى السنوات القليلة الماضية في تغيير الطريقة التي يفكر بها الاقتصاديون حول كيفية اتخاذ القرارات البشرية. تنحرف القرارات والإجراءات البشرية ، بشكل كبير وثابت في كثير من الأحيان ، عن التوقعات العقلانية ، والتي غالبًا ما يتم قبولها كالمعتاد. 49 (49 - Rotemberg (1984) ، على سبيل المثال ، يناقش الرفض الإحصائي لنماذج التوقعات العقلانية للاستهلاك والطلب على اليد العاملة.) ويسيطر الاستدلال على عملية صنع القرار البشري. وغالبًا ما تتشكل التوقعات التي شكلها الناس إلى حد كبير من خلال تاريخ وعواطف وأفعال الآخرين ، وكذلك من خلال الحساب العقلاني.

يبدو أن هذا السلوك مهم لكل من الأفراد (الاقتصاد الجزئي) والمجتمعات (الاقتصاد الكلي). على سبيل المثال ، أثبتت الروايات الشعبية التي تطورت في الأسواق المالية وفي الخطاب العام اليومي أنها عوامل تجريبية مهمة لتقلبات أسعار الأصول والنشاط الاقتصادي .50 (50 - Tuckett and Nyman (2017) ، Shiller (2017) and Nyman et al (2018) ) يمكن أن تكون هذه الروايات مهمة بشكل خاص خلال فترات الضغوط الاقتصادية والمالية ، عندما تشتد العواطف ، وتكتسب القصص الاجتماعية أهمية إضافية.

ومع ذلك ، عندما يتعلق الأمر بقياس مثل هذا السلوك ، سواء على مستوى الاقتصاد الجزئي أو الاقتصاد الكلي ، فإن طرقنا الحالية غالبًا ما تكون سيئة التجهيز. اصطياد المشاعر والتفضيلات الحقيقية للناس أمر صعب للغاية. إن الاستطلاعات التقليدية للمشاركين في السوق أو عامة الناس ، كقاعدة عامة ، متحيزة في عينتهم ويتم صياغتها في الردود. كما هو الحال في فيزياء الكم ، فإن فعل الملاحظة نفسه يمكن أن يغير السلوك.

قد تتطلب هذه الحقائق دراسة طرق غير تقليدية لتحديد تفضيلات الناس وحالاتهم المزاجية. كمثال حديث ، يمكن للمرء أن يستشهد ببيانات حول تنزيلات الموسيقى من Spotify ، والتي تم استخدامها جنبًا إلى جنب مع طرق البحث الدلالية المطبقة على كلمات الأغاني لتوفير مؤشر على مزاج الناس. ومن المثير للاهتمام أن مؤشر المشاعر الناتج ، على الأقل ، يتتبع إنفاق المستهلكين تمامًا بالإضافة إلى مسح ثقة المستهلك ميشيغان. 51 (51 - Sabouni 2018).

ولماذا تناولت الموسيقى؟ يمكن لأذواق الأشخاص في الكتب والتلفزيون والإذاعة أيضًا فتح نافذة في أرواحهم. تماما مثل ذوقهم في الألعاب. في الواقع ، أنا مهتم بإمكانية استخدام تقنيات الألعاب ليس فقط لاستخراج البيانات حول تفضيلات الأشخاص ، ولكن أيضًا كوسيلة لتوليد بيانات حول التفضيلات والإجراءات.

غالبًا ما تضع النماذج الحالية ، التجريبية والنظرية ، افتراضات قوية حول سلوك الوكيل. تستند النماذج النظرية إلى الافتراضات البديهية. تستند النماذج التجريبية إلى أنماط السلوك التاريخية. هذه القيود قد تكون أو لا يتم تأكيدها في السلوك المستقبلي. إذا لم يكن الأمر كذلك ، فسيتم تحليل النموذج إلى عينة ، كما فعل نموذج DSGE (الاستنتاجي) ونموذج الإنفلونزا من Google (الاستقرائي).

يمكن استخدام بيئة الألعاب لفهم السلوك بحيث يكون هناك قيود أقل. سيُلاحَظ سلوك الناس مباشرة في فعل اللعبة ، والذي ، شريطة أن يكون هذا السلوك انعكاساً معقولاً للسلوك الحقيقي ، سيعطينا بيانات جديدة. نظرًا لأن هذا عالم افتراضي ، وليس عالمًا حقيقيًا حيث يتم التحكم في الصدمات وتنظيمها ، يمكن أن يسهل ذلك حل مشاكل السببية وتحديد الهوية استجابةً للصدمات ، بما في ذلك الصدمات السياسية.

هناك بالفعل ألعاب تشمل العديد من الأشخاص والاقتصادات البدائية التي تسمح للسلع والمال بتغيير الأيدي بين المشاركين. وتشمل هذه EVE Online و World of Warcraft. بدأ بعض الاقتصاديين في استخدام تكنولوجيا الألعاب لفهم السلوك .52 (52 - على سبيل المثال ، Lehdonvirta و Castronova (2014) على سبيل المثال ، استخدم ستيفين ليفيت (من شهرة Freakonomics) منصات الألعاب لفهم منحنى الطلب على السلع الافتراضية .53 (53 - Levitt et al (2016)

الفكرة هنا هي استخدام لعبة ديناميكية مع العديد من الأشخاص لدراسة السلوك في الاقتصاد الافتراضي. سيشمل ذلك تفاعل اللاعبين - على سبيل المثال ، ظهور روايات شعبية تشكل نفقات أو مدخرات. وقد يشمل ذلك رد فعل اللاعبين على التدخل في السياسة - على سبيل المثال ، رد فعلهم على السياسات النقدية والتنظيمية. في الواقع ، في الدور الأخير ، يمكن أن تكون اللعبة بمثابة منصة اختبار للعمل السياسي - مجموعة تركيز رقمية ديناميكية واسعة النطاق .54 (54 - كان يانيس فاروفاكيس قد شارك سابقًا في فكرة مماثلة: uk.businessinsider.com/yanis-varoufakis-valve -Gameeconomy-greek-finance-2015-2 )

يقوم متخصصو الذكاء الاصطناعي بإنشاء بيئات افتراضية لتسريع عملية دراسة ديناميات الأنظمة. يسمح "التعلم باستخدام التعزيز" للخوارزميات بالتعلم والتحديث بناءً على التفاعلات بين اللاعبين الافتراضيين بدلاً من الخبرة التاريخية المحدودة. 55 (55 - انظر deepmind.com/blog/deep-reinforcement-learning للمناقشة) على الأقل من حيث المبدأ ، سيسمح الاقتصاد الافتراضي للسياسيين بالمشاركة في تدريب التعزيز الخاص بهم ، مما يسرع عملية اكتشافهم حول سلوك النظام الاقتصادي والمالي المعقد.

استنتاج


فهل ستفي البيانات الضخمة بوعدها؟ أنا متأكد من أنه سيكون كذلك. يحتاج الاقتصاد والتمويل إلى الاستثمار باستمرار في البيانات الضخمة وتحليلات البيانات لتحقيق التوازن بين المقاييس المنهجية. وتبين الدراسات المبكرة ، بما في ذلك في البنك ، أن العوائد من هذه الأنشطة يمكن أن تكون عالية ، مما يعمق فهمنا للاقتصاد والنظام المالي.

من الأفضل الحصول على هذه النتائج إذا تم توثيق التعاون بين السلطات الإحصائية وصانعي السياسات والقطاع التجاري ومراكز البحوث والأوساط الأكاديمية. يمكن لبنك إنجلترا أن يلعب دورًا حفازًا في تجميع هذه الخبرة. يمكن لـ DAFM أن تفعل الشيء نفسه. أتمنى كل النجاح لـ DAFM وأتطلع إلى العمل معك.

المراجع
Abad, J, Aldasoro, I, Aymanns, C, D»Errico, M, Rousová, L F, Hoffmann, P, Langfield, S, Neychev, M and Roukny, T (2011), «Shedding light on dark markets: First insights from the new EU-wide OTC derivatives dataset», ESRB Occasional Paper Series, No. 11.

Albertazzi, U, Becker, B and Boucinha, M (2018), «Portfolio rebalancing and the transmission of largescale asset programmes: evidence from the euro area», ECB Working Paper Series, No. 2125.

Ali, R, Haldane, A and Nahai-Williamson, P (2012), «Towards a common financial language», paper available at www.bankofengland.co.uk/paper/2012/towards-a-common-financial-language
Anderson, C (2008), «The End of Theory: The Data Deluge Makes The Scientific Method Obsolete», Wired Magazine, 23 June.

Anson, M, Bholat, D, Kang, M and Thomas, R (2017), «The Bank of England as lender of last resort: new historical evidence from daily transactional data», Bank of England Staff Working Paper, No. 691.

Bacon, F (1620), Novum Organum.

Bagehot, W (1873), Lombard Street: A Description of the Money Market, Henry S. King & Co.

Bahaj, S, Foulis, A and Pinter, G (2017), «Home values and firm behaviour», Bank of England Staff Working Paper, No. 679.

Bank of England and Procyclicality Working Group (2014), «Procyclicality and structural trends in investment allocation by insurance companies and pension funds», Discussion Paper, July.

Baptista, R, Farmer, JD, Hinterschweiger, M, Low, K, Tang, D and Uluc, A (2016), «Macroprudential policy in an agent-based model of the UK housing market», Bank of England Staff Working Paper, No. 619.

Bean, C (2016), «Independent Review of UK Economic Statistics», available at www.gov.uk/government/publications/independent-review-of-uk-economic-statistics-final-report
Benetton, M, Bracke, P and Garbarino, N (2018), «Down payment and mortgage rates: evidence from equity loans», Bank of England Staff Working Paper, No. 713.

Bholat, D, Brookes, J, Cai, C, Grundy, K and Lund, J (2017), «Sending firm messages: text mining letters from PRA supervisors to banks and building societies they regulate, Bank of England Staff Working Paper, No. 688.

Bholat, D, Hansen, S, Santos, P and Schonhardt-Bailey, C (2015), «Text mining for central banks», Bank of England Centre for Central Bank Studies Handbook.

Bonollo, M, Crimaldi, I, Flori, A, Gianfanga, L and Pammolli, F (2016), «Assessing financial distress dependencies in OTC markets: a new approach using trade repositories data», Financial Markets and Portfolio Management, Vol. 30, No. 4, pp. 397-426.

Bracke, P and Tenreyro, S (2016), «History dependence in the housing market», Bank of England Staff Working Paper, No. 630.

Carney, M (2015), speech at Launch Conference for One Bank Research Agenda, available at www.bankofengland.co.uk/speech/2015/one-bank-research-agenda-launch-conference

Cavallo, A and Rigobon, R (2016), «The Billion Prices Project: Using Online Prices for Measurement and Research», Journal of Economic Perspectives, Vol. 30, No. 2, pp. 151-78.

Chakraborty, C, Gimpelewicz, M and Uluc, A (2017), «A tiger by the tail: estimating the UK mortgage market vulnerabilities from loan-level data, Bank of England Staff Working Paper, No. 703.

Chakraborty, C and Joseph, A (2017), «Machine learning at central banks», Bank of England Staff Working Paper, No. 674.

Cielenska, O, Joseph, A, Shreyas, U, Tanner, J and Vasios, M (2017), «Gauging market dynamics using trade repository data: the case of the Swiss franc de-pegging», Bank of England Financial Stability Paper, No. 41.

Cœuré, B (2017), «Policy analysis with big data», speech at the conference on «Economic and Financial Regulation in the Era of Big Data».

Coyle, D (2014), GDP: A Brief but Affectionate History, Princeton University Press.

Duffie, D, Gârleanu, N and Pedersen, L (2005), «Over-the-Counter Markets», Econometrica, Vol. 73, No.6, pp. 1815-1847.

Dwoskin, E (2015), «New Report Puts Numbers on Data Scientist Trend», Wall Street Journal, 7 October.

Economist (2017), «The world»s most valuable resource is no longer oil, but data», article on 6 May 2017.

Ericsson (2017), Ericsson Mobility Report, November 2017.

Farrell, D and Wheat, C (2015), «Profiles of Local Consumer Commerce», JPMorgan Chase & Co. Institute.

Financial Stability Board (2010), «Implementing OTC Derivatives Market Reforms», Financial Stability Board.

Fouquet, R and Broadberry, S (2015), «Seven Centuries of European Economic Growth and Decline», Journal of Economic Perspectives, Vol. 29, No. 4, pp. 227-244.

Ginsberg, J, Hohebbi, M, Patel, R, Brammer, L, Smolinski, M and Brilliant, L (2009), «Detecting influenza epidemics using search engine data», Nature, Vol. 457, pp. 1012-1014.

Goldsmith-Pinkham, P, Hirtle, B and Lucca, D (2016), «Parsing the Content of Bank Supervision», Federal Reserve Bank of New York Staff Reports, No. 770.

Haldane, A (2016), «The Dappled World», speech available at www.bankofengland.co.uk/speech/2016/the-dappled-world

Haldane, A and McMahon, M (forthcoming), «Central Bank Communication and the General Public», American Economic Review: Papers & Proceedings.

Henderson, V, Storeygard, A and Weil, D (2011), «A Bright Idea for Measuring Economic Growth», American Economic Review: Papers & Proceedings, Vol. 101, No. 3, pp. 194-99.

Henke, N, Bughin, J, Chui, M, Manyika, J, Saleh, T, Wiseman, B and Sethupathy, G (2016), «The Age of Analytics: Competing in a Data-Driven World», McKinsey Global Institute.

IMF (2018), «Cyclical Upswing, Structural Change», World Economic Outlook, April 2018.

Lagos, R, Rocheteau, G and Weill, P-O (2011), «Crises and liquidity in over-the-counter markets», Journal of Economic Theory, Vol. 146, No. 6, pp. 2169-2205.

Lazer, D, Kennedy, R, King, G and Vespignani, A (2014), «The Parable of Google Flu: Traps in Big Data Analysis», Science, Vol. 343, pp. 1203-1205.

Leamer, E (1983), «Let»s Take the Con Out of Econometrics», American Economic Review, Vol. 73, No. 1, pp. 31-43.

Lehdonvirta, V and Castronova, E (2014), Virtual Economies: Design and Analysis, MIT Press.

Levitt, S, List, J, Neckermann, S and Nelson, D (2016), «Quantity discounts on a virtual good: The results of a massive pricing experiment at Kind Digital Entertainment», Proceedings of the National Academy of Sciences of the United States of America, Vol. 113, No. 27, pp. 7323-7328.

Moore, G (1965), «Cramming more components onto integrated circuits», Electronics, Vol. 38, No. 8.

Nyman, R, Kapadia, S, Tuckett, D, Gregory, D, Ormerod, P and Smith, R (2018), «News and narratives in financial systems: exploiting big data for systemic risk assessment», Bank of England Staff Working Paper, No. 704.

Obstfeld, M and Rogoff, K (2001), «The Six Major Puzzles in International Macroeconomics: Is There a Common Cause?», NBER Macroeconomics Annual, Vol. 15, MIT Press.

Popper, K (1934), Logik der Forschung, Akademie Verlag.

Popper, K (1959), The Logic of Scientific Discovery, Routledge.

Rotemberg, J (1984), «Interpreting the Statistical Failures of Some Rational Expectations Models», American Economic Review, Vol. 74, No. 2, pp. 188-193.

Sabouni, H (2018), «The Rhythm of Markets», mimeo.

Schonhardt-Bailey, C (2013), Deliberating American Monetary Policy: A Textual Analysis, MIT Press.

Schwab, K (2017), The Fourth Industrial Revolution, Portfolio Penguin.

Shiller, R (2017), «Narrative Economics», American Economic Review, Vol. 104, No. 4, pp. 967-1004.

SINTEF (2013), «Big Data, for better or worse: 90% of world»s data generated over last two years», ScienceDaily, 22 May.

Stiglitz, J (2018), «Where modern macroeconomics went wrong», Oxford Review of Economy Policy, Vol. 34, No. 1-2, pp. 70-106.

Tuckett, D and Nyman, R (2017), «The relative sentiment shift series for tracking the economy», mimeo.

Turrell, A, Speigner, B, Thurgood, J, Djumalieva, J and Copple, D (forthcoming), «Using Online Vacancies to Understand the UK Labour Market from the Bottom-Up», Bank of England Staff Working Paper.

All Articles