Akankah Big Data Menepati Janji Mereka?

Dari penerjemah


Ini adalah terjemahan dari laporan ekonom terkemuka Bank of England tentang kemungkinan menggunakan data besar dalam kegiatan organisasi ini. Judul asli "Akankah Big Data Menepati Janji?" 30 April 2018.

Mereka berbicara banyak tentang Big Data, tetapi, secara pribadi, saya sering mendapat kesan bahwa kita, sebagai orang Aborigin yang mengenakan cawat, mengenakan pernak-pernik yang tidak berharga pada kita. Laporan ini, menurut pendapat saya, menegaskan bahwa, pada kenyataannya, bekerja dengan Big Data adalah proses yang agak rumit, tetapi produktif.

Tentu saja, laporan ini sangat berbeda dari yang mereka katakan kepada kami, karena Anda sendiri mengerti bahwa laporan ini dirancang untuk audiens yang berbeda. Kualitasnya, menurut saya, patut dicontoh. Secara agregat, status organisasi Bank of England dan spesialis yang mempresentasikan hasil ini, menjadi jelas bagaimana, dalam banyak kasus, analisis Big Data dapat digunakan. Beberapa kesimpulannya, dalam formulasi kecil, dapat dirumuskan sebagai berikut:

  • sangat penting untuk menentukan arah dan tingkat dekomposisi data dengan contoh tindakan Bank Swiss;
  • dalam sejumlah besar kasus, nilainya dapat muncul dalam hasil baru, misalnya, pembentukan kata-kata dari dokumen manajemen Bank of England.

Dia hanya memberi petunjuk tentang beberapa hasil ketika industri game dapat mengganti metode Monte Carlo.

Terjemahan mesin, dengan koreksi kecil, agar tidak memotong telinga setelah kata.

Saya senang berada di sini untuk meluncurkan pusat penelitian Analisis Data untuk Keuangan dan Makro (DAFM) di King's College Business School. Saya ingin mengucapkan selamat kepada profesor Georgios Kapetanios dan Georgios Cortareas, sebagai co-directors (serta mantan kolega), untuk mengatur landasan peluncuran untuk pusat dan mempersiapkannya untuk tinggal landas.

Saya percaya bahwa penerapan metode analisis data untuk menyelesaikan banyak masalah mendesak di bidang keuangan dan ekonomi makro memiliki prospek yang bagus. Untuk alasan ini, Bank Inggris sekitar empat tahun yang lalu membuat unit analisis datanya sendiri. Dan itulah mengapa saya sangat menyambut penciptaan pusat baru ini sebagai sarana untuk mewujudkan janji ini.

Tetapi akankah big data menepati janji mereka? Saya ingin mencoba mengilustrasikan beberapa janji big data ini, serta potensi jebakan, menggunakan contoh-contoh dari studi terbaru Bank of England pada sistem ekonomi dan keuangan. Sebagai kesimpulan, saya akan memberikan beberapa pemikiran yang lebih spekulatif tentang penelitian masa depan pada data besar.1 (1- Cœuré (2017) menawarkan ringkasan yang sangat baik tentang potensi Big Data untuk meningkatkan pembuatan kebijakan, khususnya di bank sentral.)

Jalannya kurang diikuti


Hal pertama yang saya katakan adalah bahwa data besar dan metode analisis data bukanlah hal baru. Namun, dalam beberapa tahun terakhir mereka telah menjadi salah satu bidang pertumbuhan tercepat di kalangan akademis dan komersial. Selama periode ini, data menjadi minyak baru; metode analisis data telah menjadi kilang minyak dan kilang waktu mereka; dan perusahaan informasi telah menjadi raksasa minyak baru.2 (2- Misalnya, Economist (2017), Henke et al (2016).)

Namun demikian, ekonomi dan keuangan sejauh ini agak terkendali sehubungan dengan persetujuan universal dari "demam minyak" ini. Untuk ekonomi dan keuangan, penggunaan metode analisis data kurang umum, setidaknya dibandingkan dengan disiplin ilmu lain. Salah satu diagnosa sederhana dalam hal ini berasal dari pertimbangan interpretasi yang sangat berbeda dari ungkapan "data mining" oleh mereka yang berada di dalam dan di luar ekonomi dan keuangan.

Bagi para ekonom, sedikit dosa lebih menjijikkan daripada data mining. Ini adalah obat penjahat terakhir yang terlibat dalam "perburuan regresi," yang hanya melaporkan hasil regresi yang paling sesuai dengan hipotesis yang awalnya ingin diuji oleh peneliti. Inilah yang menempatkan con dalam ekonometrik. 3 (3- Leamer 1983) bagi sebagian besar ekonom, analisis data ini memiliki kemiripan yang menyedihkan dengan pengeboran minyak - bisnis penambangan yang kotor yang disertai dengan efek merusak besar pada kesehatan.

Bagi para ilmuwan data, situasinya mungkin lebih berbeda. Bagi mereka, penambangan data adalah cara mengekstraksi sumber daya baru yang berharga dan menggunakannya. Ini memungkinkan Anda untuk mendapatkan ide-ide baru, membuat produk baru, membangun hubungan baru, mempromosikan teknologi baru. Ini adalah bahan mentah untuk gelombang baru produktivitas dan inovasi, Revolusi Industri Keempat yang baru lahir 4 (4 - Lihat, misalnya, Schwab 2017)

Apa yang menjelaskan kehati-hatian beberapa ekonom tentang data besar? Sebagian dari jawabannya terletak pada metodologi. 5 (5 - Haldane 2016) Sebagian ekonomi yang baik mengikuti jejak metodologis Karl Popper pada 1930-an. Popper menganjurkan pendekatan deduktif untuk kemajuan ilmiah. 6 (6 - Popper (1934) dan Popper (1959)) Ini dimulai dengan aksioma, diteruskan dari aksioma ke teori, dan baru kemudian menerima hipotesis untuk data. Dengan kata lain, teori mendahului pengukuran.

Ada alternatif, pendekatan induktif. Ini bahkan memiliki akar yang lebih dalam dalam karya Francis Bacon dari awal tahun 1600. 7 (7 - Bacon 1620) Dia mulai dengan data yang tidak dibatasi oleh aksioma dan hipotesis, dan kemudian menggunakannya untuk menginformasikan pemilihan perilaku. Dengan kata lain, data mendahului teori. Memang, beberapa peneliti data telah menyarankan bahwa pendekatan semacam itu dapat menandakan "akhir dari teori." 8 (8 - Anderson 2008)

Oleh karena itu, di mana beberapa ekonom cenderung melihat jebakan dalam data besar, pakar data melihat prospek yang menjanjikan. Ketika beberapa ekonom cenderung melihat ancaman lingkungan yang ditimbulkannya, analis data melihat potensi ekonomi. Saya sedikit karikatur, tetapi hanya sedikit. Jadi siapa yang benar? Dan apakah era big data menandakan aliran minyak atau tumpahan minyak?

Benar, seperti yang sering terjadi, mungkin terletak di suatu tempat di tengah. Kedua pendekatan deduktif dan induktif dapat menawarkan wawasan ke dunia. Mereka lebih baik dianggap sebagai tambahan metodologis daripada sebagai pengganti. Dengan kata lain, menggunakan satu pendekatan secara terpisah meningkatkan risiko kesimpulan yang salah dan berpotensi kesalahan serius dalam pemahaman dan politik. Biarkan saya memberi Anda beberapa contoh untuk diilustrasikan.

Selama krisis keuangan global, sekarang cukup diterima bahwa model dinamis stokastik umum (DSGE) stokastik dinamis jatuh di pagar pertama.9 (9 - Misalnya, Stiglitz 2018) Dia tidak bisa menjelaskan dinamika siklus bisnis selama atau setelah krisis. Meskipun secara teori murni, ternyata secara empiris rapuh. Saya percaya bahwa kerapuhan empiris ini telah muncul karena ketergantungan metodologi yang berlebihan pada metode deduktif. Atau, dengan kata lain, karena fakta bahwa terlalu sedikit perhatian diberikan pada data riil masa lalu, termasuk krisis.

Sebagai contoh tandingan, pada 2008 Google meluncurkan model prognostik wabah influenza berdasarkan frasa seperti "tanda-tanda flu." 10 (10 - Ginsberg et al 2009) Ini telah melakukan banyak pekerjaan untuk melacak wabah influenza di AS pada tahun 2009-10. Tetapi pada tahun-tahun berikutnya, prediksi model ini mengalami kekalahan telak.11 (11 - Lazer et al 2014) Saya menyarankan bahwa kerapuhan empiris ini muncul karena ketergantungan yang berlebihan pada hukum empiris dan komitmen yang berlebihan terhadap metode induktif. Atau, dengan kata lain, terlalu sedikit perhatian diberikan pada penyebab medis yang dalam dari wabah flu di masa lalu.

Dalam kasus pertama, kerapuhan empiris muncul karena terlalu sempit serangkaian aksioma dan keterbatasan, karena terlalu banyak penekanan pada teori, dan bukan pada korelasi nyata dan pengalaman sejarah. Dalam kasus kedua, kerapuhan empiris muncul karena serangkaian aksioma dan pembatasan yang terlalu lemah karena korelasi empiris yang diamati, yang memainkan peran terlalu besar sehubungan dengan teori dan kausalitas.

Dalam kedua kasus, kesalahan ini dapat dikurangi jika pendekatan induktif dan deduktif digunakan secara komplementer atau berulang. Pendekatan berulang ini memiliki silsilah yang kuat dalam disiplin ilmu lain. Sejarah kemajuan dalam banyak disiplin ilmu termasuk proses belajar dua arah antara teori dan empirisme, ketika dalam beberapa kasus teori merangsang pengukuran, dan dalam kasus lain, teori motivasi pengukuran dalam loop umpan balik yang berkelanjutan. yang telah menangani ilmu pengetahuan, baik laki-laki yang bereksperimen atau laki-laki yang terdiri dari dogma. Orang-orang yang bereksperimen seperti semut, mereka hanya mengumpulkan dan menggunakan, para penakunya menyerupai laba-laba, yang membuat sarang laba-laba dari bahan mereka sendiri. Tentu saja: ia mengumpulkan bahan-bahannya dari bunga-bunga taman dan ladang,tetapi mentransformasikan dan mencernanya dengan kekuatannya sendiri. ")

Salah satu contoh dari pendekatan ini, dibahas oleh Gubernur Carney selama peluncuran program analisis datanya sendiri dari Bank Dunia, menyangkut dinamika pergerakan planet. (13 - Carney 2015) Adalah Sir Isaac Newton (mantan pemilik Royal Mint yang juga mencetak uang) yang mengembangkan teori fisik gerak surgawi. Tetapi teori ini dibangun di atas bahu empiris raksasa ilmiah lain, Johannes Kepler. Ketika datang ke gerakan planet, empirisme pertama kali memimpin teori, induktansi memimpin deduktif.

Itu sama dari waktu ke waktu ketika kami memahami pergerakan ekonomi dan pasar keuangan. Teori Keynesian dan teori moneter dibangun di atas pengalaman empiris dari masa Depresi Hebat. Kurva Phillips berasal sebagai hukum Kepler empiris, yang hanya kemudian menerima dasar teori Newton. Banyak teka-teki keuangan yang telah dihantui oleh para ahli teori selama beberapa dekade telah dimulai sebagai anomali empiris di pasar aset.14 (14 - Obstfeld dan Rogoff (2001) membahas enam teka-teki utama dalam ekonomi makro internasional, seperti kelebihan volatilitas nilai tukar relatif terhadap fundamental.) Dalam setiap kasus, empirisme memimpin teori, induktif memimpin deduktif.

Kesimpulan saya dari semua ini jelas. Jika proses pembelajaran berulang antara empirisme dan teori ini akan terus membuahkan hasil dalam perekonomian, maka pendekatan deduktif dan induktif mungkin memerlukan penagihan yang secara umum sama. Jika demikian, maka saya pikir ekonomi dan keuangan akan mendapatkan pengembalian yang tinggi dengan melakukan investasi intelektual lebih lanjut dalam data besar dan menyertainya dengan metode analitis di masa depan.

Definisi Data Besar


Jika big data menjanjikan, maka mungkin membantu untuk memulai dengan mendefinisikan apa itu. Ini tidak mudah. Seperti halnya kecantikan, apa yang dianggap sebagai data besar ada di mata yang melihatnya. Ini juga konsep yang cair. Misalnya, jelas bahwa data tidak lagi hanya berarti angka dan kata-kata. Memang, dalam beberapa tahun terakhir telah terjadi peningkatan dalam penelitian tentang semantik, termasuk di bidang ekonomi dan keuangan.

Apa yang kurang kontroversial adalah bahwa selama dekade terakhir revolusi paling luar biasa telah terjadi dalam penciptaan, ekstraksi dan pengumpulan data, dalam arti luas. Ini adalah sebagian hasil dari hukum Moore dan kemajuan terkait dalam teknologi informasi. 15 (15 - Moore (1965) mencatat penggandaan tahunan dalam jumlah komponen per sirkuit terintegrasi) Tidak seperti minyak, yang sumber dayanya terbatas, data baru dibuat dengan kecepatan yang belum pernah terjadi sebelumnya dan memiliki cadangan hampir tak terbatas.

Diperkirakan bahwa 90% dari semua data yang pernah dihasilkan adalah dalam dua tahun terakhir. 16 (16 - SINTEF 2013) sebagian besar berasal dari jejaring sosial. Sekitar 1,5 miliar orang menggunakan Facebook setiap hari dan 2,2 miliar per bulan. Pada 2017, ada 4,4 miliar langganan ponsel cerdas, lebih dari satu untuk setiap orang kedua di planet ini. Menurut perkiraan, pada tahun 2023 jumlah pelanggan smartphone akan berjumlah 7,3 miliar, yaitu hampir satu untuk setiap orang.17 (17 - Ericsson Mobility Report 2017) Menurut perkiraan, pada 2017, 1,2 triliun foto diambil, yaitu 25 % dari semua foto yang pernah diambil 18 (18 - Lihat www.statista.com/chart/10913/number-of-photos-taken-worldwide )

Pandangan lain dari revolusi informasi ini terbuka ketika kita melihat jumlah ilmuwan yang mempelajari data. Menggunakan data pekerjaan dari situs pencarian kerja Reed, lebih dari 300 posting pekerjaan di Inggris baru-baru ini telah diposting untuk para profesional pemrosesan data.19 (19 - Menggunakan dataset di Turrell et al (akan terbit)) Hampir tidak ada di 2012. Perkiraan berdasarkan identifikasi diri di situs jejaring sosial Linked-In menunjukkan bahwa mungkin ada lebih dari 20.000 spesialis pemrosesan data di dunia.20 (20 - Dwoskin (2015). Jumlah sebenarnya dari data ilmuwan di seluruh dunia sangat tidak pasti. Banyak individu bekerja pada sains data tanpa harus menggunakan jabatan itu, tetapi kebalikannya juga benar.)

Pada saat yang sama, ada pertumbuhan pesat dalam metode baru dalam memproses, memfilter, dan mengekstraksi informasi dari data ini. Teknik pembelajaran mesin berkembang pesat. Metode yang disebut "pembelajaran dalam" melengkapi pendekatan yang ada, seperti model berbasis pohon, mesin vektor dukungan, dan mesin vektor dukungan dan teknik pengelompokan.21 (21 - Chakraborty dan Joseph 2017) Metode kosakata, model vektor dengan cepat mendapatkan momentum di bidang analisis teks ruang dan analisis semantik 22 (22 - Bholat et al 2015)

Semua metode ini menawarkan berbagai cara untuk mengekstraksi informasi dan mendapatkan kesimpulan yang andal dalam situasi di mana hubungan empiris dapat menjadi kompleks, non-linear dan berkembang dan ketika data dapat sampai pada frekuensi yang berbeda dan dalam format yang berbeda. Pendekatan ini berbeda secara signifikan dari metode ekonometrik klasik inferensi dan pengujian, sering digunakan dalam bidang ekonomi dan keuangan.

Revolusi ini dalam penyajian data dan dalam metode pemahaman mereka menawarkan kekayaan analitis. Namun, ekstraksi kekayaan ini membutuhkan kehati-hatian yang besar. Misalnya, masalah privasi data tampak lebih luas dengan data granular, dalam beberapa kasus yang dipersonalisasi. Baru-baru ini, masalah-masalah ini telah menempati tempat yang seharusnya. Pada saat yang sama, perlindungan data besar adalah salah satu tugas utama Bank dalam penelitiannya.

Janji Data Besar


Sejauh data besar dapat dikarakterisasi, ini biasanya dilakukan dengan menggunakan "tiga Vs": volume, kecepatan, dan variasi. Dengan menggunakan ketiga V sebagai struktur organisasi, izinkan saya membahas beberapa contoh tentang bagaimana data dan metode ini telah digunakan dalam penelitian perbankan baru-baru ini untuk meningkatkan pemahaman kita tentang fungsi ekonomi dan sistem keuangan.

Volume


Landasan statistik analisis ekonomi makro, setidaknya sejak pertengahan abad ke-20, adalah akun nasional. Akun nasional selalu mengandalkan dataset eklektik.23 (23 - Coyle 2014) Di masa lalu, akun penggunaan lahan, tanaman, dan ternak digunakan untuk memperkirakan produksi pertanian. Produksi industri diukur dengan berbagai sumber seperti jumlah tungku ledakan besi dan buku-buku yang terdaftar oleh British Library. Dan output dari layanan diestimasi berdasarkan pada tonase armada pedagang. 24 (24 - Fouquet and Broadberry 2015)

Dengan lebih banyak data masuk daripada sebelumnya, penggunaan sumber dan metode data baru dan eklektik, dalam hal ini, menjadi lebih umum di kantor statistik. Di bidang pengukuran harga konsumen, Proyek MIT Billion Prices menggunakan data dari lebih dari 1.000 toko online di sekitar 60 negara untuk mengumpulkan 15 juta harga setiap hari. Pendekatan ini telah ditemukan untuk memberikan informasi harga konsumen lebih tepat waktu (dan lebih murah) daripada survei tradisional 25 (25 - Cavallo dan Rigobon 2016). Juga telah ditemukan bahwa data harga online meningkatkan prakiraan inflasi jangka pendek di beberapa pasar.26 (26 - Cœuré 2017)

Dalam nada yang sama, Kantor Statistik Nasional Inggris (ONS) sedang menjajaki kemungkinan menggunakan "pengikisan web" selain metode penetapan harga yang ada. Saat ini, mereka fokus pada barang-barang seperti makanan dan pakaian. Meskipun tahun-tahun awal, manfaat potensial dalam hal meningkatkan ukuran sampel dan granularitas tampak signifikan. Sebagai contoh, ONS sejauh dikumpulkan 7.000 penawaran harga per hari untuk kelompok produk kelontong, yang lebih dari biaya bulanan saat ini untuk produk ini di CPI 27 (27 -. Lihat www.ons.gov.uk/economy/inflationandpriceindices/articles/researchindicesusingwebscrapedpricedata / august2017perbarui )

Adapun untuk mengukur PDB, sumber dan metode baru juga muncul di sini. Satu penelitian baru-baru ini menggunakan citra satelit untuk mengukur jumlah cahaya tidak wajar yang dipancarkan dari berbagai wilayah di dunia. Telah ditemukan bahwa ini memiliki hubungan yang signifikan secara statistik dengan kegiatan ekonomi.28 (28 - Henderson, Storeygard dan Weil (2011), pendekatan ini berpotensi membantu melacak kegiatan di daerah yang secara geografis dihapus, di mana metode survei statistik buruk atau di mana masalah tidak benar pengukurannya tajam.

Contoh yang lebih biasa digunakan oleh ONS dari Britania Raya dan lembaga statistik lainnya adalah apa yang disebut data administrasi. Ini termasuk data yang dikumpulkan oleh lembaga pemerintah sebagai bagian dari kegiatan mereka - misalnya, tentang pendapatan dan manfaat pajak. Di Inggris, beberapa data ini baru-baru ini tersedia untuk digunakan secara lebih luas sebagai bagian dari inisiatif data terbuka pemerintah, meskipun telah mengalami verifikasi serius.

Salah satu contoh adalah data PPN yang diterima dari UKM di sejumlah industri yang baru-baru ini digunakan oleh ONS untuk menyusun estimasi PDB berdasarkan output. Seperti halnya harga, keuntungan dalam ukuran sampel dan rincian dari penggunaan data administratif tersebut berpotensi besar. Tinjauan bulanan aktivitas bisnis ONS, sebagai suatu peraturan, didasarkan pada sampel sekitar 8.000 perusahaan yang mewakili subkelompok UKM ini. Ini saat ini dilengkapi dengan pengembalian PPN sekitar 630.000 unit pelaporan. 29 (29 - www.ons.gov.uk/economy/grossdomesticproductgdp/articles/vatturnoverinitialresearchanalysisuk/december )

Data baru ini melengkapi, bukan menggantikan, metode survei yang ada. Mereka memiliki potensi untuk meningkatkan ketepatan waktu dan keakuratan data akun nasional tentang tren ekonomi agregat. ONS memiliki pusat ilmu data sendiri untuk memimpin upaya ini. Dan organisasi penelitian baru, seperti Alan Turing Institute, melakukan pekerjaan luar biasa dengan menerapkan data dan metode baru ke dimensi ekonomi.

Bidang penelitian lain yang berpotensi bermanfaat dalam melacak arus kegiatan dalam perekonomian adalah data keuangan. Hampir semua kegiatan ekonomi meninggalkan tanda keuangan di neraca lembaga keuangan. Melacak arus kas antar lembaga keuangan dapat membantu menentukan ukuran jejak ini dan, dengan demikian, secara tidak langsung, untuk melacak aktivitas ekonomi.

Selama beberapa tahun terakhir, kami mengandalkan bank pada basis data penjualan produk-produk Kantor untuk Regulasi dan Pengawasan Keuangan (PSD). Ini adalah sumber data administrasi yang sangat terperinci tentang produk hipotek penyewa, yang dirilis di Inggris. Ini berisi data tentang hampir 16 juta hipotek sejak pertengahan 2005. PSPS memberikan alat baru yang beresolusi lebih tinggi kepada bank untuk menganalisis perilaku rumah tangga dan perumahan.

Sebagai contoh, pada tahun 2014, PSD digunakan oleh Komite Kebijakan Keuangan Bank (FPC) untuk menginformasikan dan mengkalibrasi keputusannya mengenai pembatasan makroprudensial pada hipotek berpenghasilan tinggi untuk rumah tangga di Inggris. 30 (30 - Juni 2014 Financial Stability Report) Sejak itu, kami menggunakan data ini untuk melacak karakteristik hipotek yang ada dengan pengembalian pinjaman yang tinggi dan pinjaman biaya tinggi dari waktu ke waktu.31 (31 - Chakraborty, Gimpelewicz dan Uluc 2017) Data PSD digunakan untuk memahami keputusan penetapan harga di pasar perumahan Inggris.32 (32 - Bracke dan Tenreyro (2016) dan Benetton, Bracke dan Garbarino (2018)) Dan mereka juga digunakan untuk mengkalibrasi model agen multi-industri Inggris dari pasar perumahan. 33 (33- Baptista et al 2016).

Dalam beberapa tahun terakhir, bank dan ONS telah mengembangkan satu set data yang lebih lengkap tentang aliran dana antar lembaga. Diharapkan bahwa data ini akan membantu melacak tidak hanya perubahan portofolio, tetapi juga bagaimana mereka dapat mempengaruhi pasar keuangan dan ekonomi secara keseluruhan. Sebagai contoh, apakah redistribusi portofolio oleh investor institusional memengaruhi pasar aset dan apakah mereka memiliki efek stimulasi terhadap pengeluaran? 34 (34 - Bank of England dan Procyclicality Working Group 2014) Jawaban untuk pertanyaan semacam itu membantu, misalnya, dalam menilai efektivitas pelonggaran kuantitatif. 35 (35 - Misalnya, Albertazzi, Becker dan Boucinha (2018) menunjukkan bukti saluran penyeimbangan kembali portofolio dari program pembelian aset ECB)

Data baru yang sangat terperinci juga dimasukkan ke dalam pembayaran, kredit, dan aliran bank. Beberapa dari mereka digunakan untuk memprediksi atau melacak perubahan dalam kegiatan ekonomi. Mereka telah mencapai beberapa kesuksesan. Misalnya, di Amerika Serikat, satu set data lebih dari 12 miliar transaksi kartu kredit dan debit selama periode 34 bulan baru-baru ini digunakan untuk menganalisis pola konsumsi berdasarkan usia, ukuran perusahaan, area metropolitan, dan sektor.36 (36 - Farrell and Wheat 2015 )

Seiring waktu, mungkin tipe data ini dapat membantu membuat peta arus aktivitas finansial dan real-time di seluruh perekonomian, dengan cara yang hampir sama dengan yang telah dilakukan untuk lalu lintas, informasi, atau aliran cuaca. Setelah dipetakan, dimungkinkan untuk memodelkan dan memodifikasi aliran ini menggunakan kebijakan. Saya pertama kali berbicara tentang ide ini enam tahun lalu. Hari ini dia tampak lebih dekat dari sebelumnya untuk berada dalam jangkauan kita. 37 (37 - Ali, Haldane dan Nahai-Williamson 2012)

Ini semua adalah area di mana DAFM dapat memberikan kontribusi penting bagi upaya untuk meningkatkan kualitas dan ketepatan waktu data ekonomi makro dan sistem keuangan. Sudah diketahui bahwa peluang untuk meningkatkan kualitas data akun nasional sangat besar.38 (38 - Misalnya, Bean 2016) Dan masalah pengukuran ini hanya akan meningkat ketika kita bergerak ke arah ekonomi yang semakin digital dan berorientasi layanan.

Kecepatan


Aspek kedua dari revolusi big data adalah frekuensi dan ketepatan waktunya yang besar. Semakin sering data dapat memberikan gambaran baru atau lebih akurat tentang tren di pasar keuangan dan ekonomi. Kadang-kadang juga dapat membantu dalam memecahkan masalah identifikasi kompleks yang jika tidak mengganggu data besar (seperti contoh flu Google menunjukkan) dan metode ekonometrik klasik (seperti contoh DSGE menunjukkan).

Krisis telah menunjukkan bahwa dalam situasi yang penuh tekanan, beberapa pasar keuangan terbesar dan terdalam di dunia mungkin kekurangan likuiditas. Ini telah menyebabkan beberapa pasar ini ditangkap. Menanggapi hal ini, sebagai salah satu tindakan pertamanya, G20 pada tahun 2009 setuju untuk mengumpulkan lebih banyak data tentang transaksi di pasar-pasar ini untuk membantu lebih memahami dinamika mereka dalam situasi yang penuh tekanan.39 (39 - Lihat, misalnya, FSB 2010 ) Data ini disimpan dalam repositori perdagangan.

Dalam beberapa tahun terakhir, repositori perdagangan ini telah mulai mengumpulkan data dengan basis perdagangan yang sangat rinci. Ini berarti bahwa mereka dengan cepat mengakumulasi sejumlah besar data. Misalnya, sekitar 11 juta laporan dikumpulkan setiap hari kerja di pasar valuta asing. Mereka menyediakan sumber data yang kaya ketika datang ke dinamika dan lokasi pasar keuangan frekuensi tinggi.

Salah satu contoh bias semacam itu terjadi ketika franc Swiss dipatok pada Januari 2015. Langkah tak terduga ini menyebabkan perubahan besar dalam harga aset. Frank menunjukkan gerakan tajam berbentuk V selama beberapa jam segera setelah pembatalan tautan. Dengan menganalisis data repositori perdagangan pada kontrak berjangka pada franc Swiss ke tingkat euro, beberapa kekuatan pendorong di balik perubahan ini dapat diidentifikasi. 40 (40 - Cielinska et al (2017). Makalah penelitian terbaru lainnya yang menggunakan data repositori perdagangan meliputi Abad et al (2016). ) dan Bonollo et al (2016))

Misalnya, fluktuasi frekuensi tinggi dalam mata uang Swiss dapat dibandingkan dengan volume perdagangan pada kontrak berjangka. Transaksi-transaksi ini selanjutnya dapat didekomposisi oleh rekanan, misalnya, dealer bank besar dan investor akhir. Jenis metode penguraian ini menunjukkan bahwa itu adalah penarikan likuiditas oleh bank-bank besar - dealer yang menyebabkan Frank overrun - tanda klasik pada saat gejolak pasar 41 (41 - Lihat, misalnya, Duffie, Gleanu dan Pedersen (2005) dan Lagos, Rocheteau dan Weill (2011) )) Gerakan ini sebagian berbalik segera setelah dealer melanjutkan produksi pasar.

Data repositori perdagangan juga dapat digunakan untuk menilai apakah pasak franc yang melemah memiliki efek yang bertahan lama pada kinerja pasar. Sebuah studi oleh bank menunjukkan bahwa demikian, dengan fragmentasi konstan di pasar franc forward. Likuiditas dan aktivitas antar-dealer secara struktural lebih rendah, dan volatilitas pasar semakin tinggi setelah episode ini.

Penyempurnaan tambahan dari data ini memungkinkan kami untuk menceritakan kisah sebab akibat tentang kekuatan pendorong pergerakan berbentuk-V di pasar aset setelah diputuskan tautannya. Menggunakan data tick-by-tick dan trade-by-trade paralel memungkinkan Anda mengidentifikasi pemicu dan amplifier dengan cara yang tidak mungkin dilakukan.

Contoh kedua dari penelitian yang menggunakan data lebih cepat untuk meningkatkan pemahaman kita tentang dinamika ekonomi adalah pasar tenaga kerja. Memahami perilaku gabungan antara pekerjaan dan upah tetap menjadi salah satu masalah utama makroekonomi modern. Baru-baru ini, dinamika ini dipersulit oleh perubahan dalam dunia kerja, ketika otomasi mengubah sifat dan struktur kerja.

Penelitian perbankan baru-baru ini telah menggunakan data terperinci tentang lowongan yang diumumkan untuk menjelaskan dinamika ini. 42 (42 - Turrell et al (akan terbit)) Studi ini menganalisis sekitar 15 juta lowongan selama periode sepuluh tahun. Alih-alih mengklasifikasikan lowongan berdasarkan sektor, pekerjaan, atau wilayah, ia menggunakan metode pembelajaran mesin dalam teks uraian tugas untuk mengklasifikasikan dan mengelompokkan lowongan. Hasilnya adalah skema klasifikasi “deskripsi pekerjaan” yang lebih untuk permintaan tenaga kerja.

Pendekatan ini memberikan cara yang berbeda dalam mengklasifikasikan dan menggambarkan bagaimana dunia kerja berkembang - misalnya, jenis keterampilan yang diperlukan dalam lingkungan otomasi. Skema klasifikasi juga berguna dalam menentukan hubungan antara permintaan tenaga kerja dan upah. Menggunakan klasifikasi berdasarkan uraian pekerjaan membantu mengidentifikasi hubungan yang lebih jelas antara permintaan tenaga kerja dan upah yang ditawarkan dan disepakati.
Perbedaan

Salah satu bidang penelitian big data yang berpotensi paling produktif di sektor makro dan keuangan adalah penggunaan kata-kata, bukan angka, sebagai data. Data semantik dan metode pencarian semantik memiliki silsilah yang kaya dalam ilmu sosial lainnya, seperti sosiologi dan psikologi. Namun sejauh ini, penggunaannya dalam ekonomi dan keuangan relatif terbatas. 43 (43 - Contoh penting termasuk Schonhardt-Bailey (2013) dan Goldsmith-Pinkham, Hirtle dan Lucca (2016))

Seperti ilmu sosial lainnya, ekonomi dan keuangan dikaitkan dengan pilihan manusia. Dan kita tahu bahwa orang sering mengandalkan heuristik atau cerita, daripada statistik, ketika mereka memahami dunia dan membuat keputusan. Dengan demikian, persepsi semantik dari cerita-cerita ini penting untuk memahami perilaku manusia dan membuat keputusan.

Misalnya, Bank Dunia baru-baru ini mulai mempelajari bahasa yang digunakannya dalam komunikasi eksternal, baik dengan perusahaan keuangan atau masyarakat luas. Sebagai contoh, Michael McMahon dari Universitas Oxford dan saya baru-baru ini menghargai bagaimana menyederhanakan kata-kata Komite Kebijakan Moneter (MPC) dalam laporan inflasi akhir tahun lalu meningkatkan kesadaran publik akan pesan-pesan kebijakan moneter. 44 (44 - Haldane dan McMahon (akan datang)).

Contoh kedua meneliti aspek yang jauh lebih dipelajari dari pengambilan keputusan bank - pengawasan perusahaan keuangan. 45 (45 - Bholat et al 2017) Ini didasarkan pada analisis tekstual pertemuan ringkasan berkala rahasia (PSM) Bank rahasia yang dikirim ke perusahaan keuangan. Ini mungkin adalah satu-satunya surat paling penting yang dikirim oleh otoritas pengaturan kehati-hatian (PRA) secara teratur ke perusahaan, menetapkan tinjauan peraturan terhadap risiko perusahaan dan membutuhkan tindakan untuk mengurangi risiko tersebut. Menggunakan metode pembelajaran mesin yang disebut hutan acak, para peneliti menganalisis surat-surat ini dan mengekstrak data tentang nada dan konten mereka.

Jenis analisis ini memiliki sejumlah aplikasi kebijakan. Ini dapat digunakan untuk menilai apakah surat mengirim pesan pengawasan yang jelas dan konsisten ke perusahaan. Misalnya, Anda dapat membandingkan kekuatan dan isi surat-surat ini dengan penilaian internal bank tentang kekuatan dan kelemahan perusahaan. Apakah kedua pendekatan ini konsisten dengan sistem pengawasan Bank? Secara umum, penelitian menunjukkan bahwa mereka.

Pendekatan ini juga dapat digunakan untuk mengevaluasi bagaimana gaya pengawasan telah berkembang dari waktu ke waktu. Misalnya, bagaimana perubahannya sejak transisi dalam model pengawasan dari manajemen jasa keuangan (FSA) ke PRA? Studi ini menunjukkan bahwa, dibandingkan dengan dua mode ini, pertukaran pesan pengawasan menjadi lebih menjanjikan, formal dan bermakna, yang konsisten dengan model baru kegiatan pengawasan PRA.

Latihan ini, saya pikir, adalah contoh yang baik dari penerapan metodologi baru (hutan acak) ke database yang benar-benar baru (penilaian pengawasan bank) di bidang politik, yang belum dipelajari oleh para peneliti sebelumnya (pengawasan perusahaan keuangan). Dia sampai pada kesimpulan yang terkait langsung dengan masalah kebijakan. Jadi, saya pikir itu dengan indah menekankan prospek data besar.

Dalam contoh terakhir saya, bukan baru, tetapi data lama digunakan. Namun, saya pikir ini adalah ilustrasi yang bagus tentang bagaimana metode baru juga dapat digunakan untuk memahami masa lalu. Jauh sebelum Bank bertanggung jawab atas kebijakan moneter dan stabilitas keuangan, salah satu peran utama bank adalah memberikan pinjaman, sebagai upaya terakhir, kepada bank komersial yang mengalami tekanan likuiditas.

Sulit untuk menentukan tanggal secara akurat, tetapi bank mulai melakukan operasi seperti itu dengan serius, mungkin sekitar waktu ketika Inggris menghadapi serangkaian kepanikan perbankan yang konstan pada tahun 1847, 1857 dan 1866. Bank merespons kepanikan ini dengan menyediakan likuiditas untuk mendukung bank. Fasilitas kredit terakhir muncul, ketika Badgehot kemudian mulai menyebutnya. 46 (46 - Bagehot 1873) Bahkan, kemudian Beydzhhot mendefinisikan prinsip-prinsip pemberian pinjaman seperti itu: pinjaman itu harus terjadi secara bebas, dengan penalti untuk jaminan yang baik.

Sebuah pertanyaan historis yang menarik terkait dengan hari ini adalah apakah bank benar-benar menganut prinsip-prinsip ini ketika memberikan pinjaman kepada upaya terakhir selama kepanikan tahun 1847, 1857 dan 1866. Untuk mengevaluasi ini, kami mengambil data dari buku-buku kertas raksasa yang mencatat perubahan dalam neraca bank, di mana intervensi ini dicatat pada kredit untuk pinjaman, rekanan untuk rekanan, suku bunga untuk tingkat bunga. 47 (47 - Anson et al 2017)

Menguraikan data ini bermanfaat karena catatan tulisan tangan dalam buku-buku dibuat oleh sejumlah kecil pegawai selama tiga krisis - salah satu keuntungan tidak langsung dari kesinambungan bisnis. Sementara data terutama direkam secara manual, proyek ini mengembangkan sistem pengenalan gambar menggunakan algoritma jaringan saraf, yang akan kami gunakan di masa depan untuk mengubah operasi buku sejarah menjadi data yang dapat dibaca mesin abad ke-21.

Data tentang peminjaman historis ke upaya terakhir bank adalah data besar dan baru yang sangat terperinci dari zaman dulu. Ini menunjukkan bahwa pendekatan Bank terhadap pinjaman dalam kasus-kasus ekstrem telah berubah secara signifikan selama krisis pertengahan abad ke-19. Ini berarti bahwa pada saat krisis 1866 Bank kurang lebih mengikuti prinsip-prinsip pemberian pinjaman sebagai upaya terakhir, yang kemudian ditetapkan oleh Badgehot. Ini adalah contoh lain dari teori empiris terkemuka.

Metode pembelajaran mesin diterapkan pada statistik yang dikumpulkan dan dilaporkan secara berkala oleh bank. Secara khusus, metode ini digunakan untuk mengidentifikasi kesalahan atau anomali dalam sumber data yang diberikan kepada bank. Ini membuat pembersihan data jauh lebih sistematis dan efisien daripada mungkin dengan proses manual. Metode analisis data juga dapat digunakan untuk membandingkan sumber data granular baru. Ini tidak hanya menyediakan cara lain untuk memverifikasi keandalan data, tetapi juga dapat memberikan gagasan bahwa sumber data individual tidak dapat mengungkapkannya sendiri .48 (48 - Bahaj, Foulis and Pinter (2017), misalnya, mencocokkan tingkat perusahaan data akuntansidata harga rumah tingkat transaksi dan data hipotek perumahan tingkat pinjaman untuk menunjukkan bagaimana harga rumah direktur SME dapat memengaruhi investasi perusahaan dan upah mereka.) Di Bank of England, seperti di tempat lain, robot sedang naik.

Pandangan ke masa depan


Melihat ke masa depan, dapat dicatat bahwa ada banyak area potensial di mana sumber-sumber dan metode baru ini dapat diperluas untuk meningkatkan pemahaman bank tentang sistem ekonomi dan keuangan. Dari daftar panjang, izinkan saya membahas satu yang menurut saya sangat penting.

Ekonomi perilaku, dengan benar, telah membuat percikan besar selama beberapa tahun terakhir dalam mengubah cara ekonom berpikir tentang bagaimana keputusan manusia dibuat. Keputusan dan tindakan manusia sering berbeda secara signifikan dan konsisten dari ekspektasi rasional, yang sering dianggap sebagai norma.49 (49 - Rotemberg (1984), misalnya, membahas penolakan statistik dari model ekspektasi rasional untuk konsumsi dan permintaan tenaga kerja.) Aturan praktis dan heuristik mendominasi pengambilan keputusan manusia. Dan harapan yang dibentuk oleh orang-orang seringkali dibentuk sebagian besar oleh sejarah, emosi dan tindakan orang lain, serta oleh perhitungan rasional.

Perilaku ini tampaknya penting baik untuk individu (ekonomi mikro) maupun bagi masyarakat (ekonomi makro). Misalnya, narasi populer yang berkembang di pasar keuangan dan dalam wacana publik sehari-hari telah terbukti sebagai faktor empiris penting untuk fluktuasi harga aset dan aktivitas ekonomi. 50 (50 - Tuckett dan Nyman (2017), Shiller (2017) dan Nyman et al (2018)) ) Narasi ini dapat menjadi sangat penting selama periode tekanan ekonomi dan keuangan, ketika emosi memanas, dan cerita sosial mendapatkan signifikansi tambahan.

Namun, ketika datang untuk mengukur perilaku seperti itu, apakah di tingkat mikro atau ekonomi makro, metode kami yang ada sering tidak dilengkapi dengan baik. Menangkap perasaan dan preferensi orang yang sebenarnya sangat sulit. Survei tradisional terhadap pelaku pasar atau masyarakat umum, sebagai suatu peraturan, bias dalam sampel mereka dan dirumuskan dalam tanggapan. Seperti dalam fisika kuantum, tindakan pengamatan itu sendiri dapat mengubah perilaku.

Realitas ini mungkin memerlukan studi tentang cara-cara yang tidak konvensional untuk mengidentifikasi preferensi dan suasana hati orang. Sebagai contoh baru-baru ini, seseorang dapat mengutip data tentang unduhan musik dari Spotify, yang digunakan bersama-sama dengan metode pencarian semantik yang diterapkan pada lirik lagu untuk memberikan indikator suasana hati orang. Menariknya, indeks sentimen yang dihasilkan, setidaknya, melacak pengeluaran konsumen sama baiknya dengan Survei Keyakinan Konsumen Michigan.51 (51 - Sabouni 2018).

Dan mengapa berkutat pada musik? Selera orang dalam buku, televisi, dan radio juga bisa membuka jendela jiwa mereka. Sama seperti selera mereka dalam game. Memang, saya tertarik pada potensi menggunakan teknik permainan tidak hanya untuk mengekstraksi data tentang preferensi orang, tetapi juga sebagai sarana menghasilkan data tentang preferensi dan tindakan.

Model yang ada, empiris dan teoritis, sering membuat asumsi kuat tentang perilaku agen. Model teoritis didasarkan pada asumsi aksiomatik. Model empiris didasarkan pada pola perilaku historis. Pembatasan ini mungkin atau tidak dapat dikonfirmasi dalam perilaku di masa mendatang. Jika ini bukan masalahnya, maka model tersebut akan didekomposisi menjadi sampel, seperti model DSGE (deduktif) dan model flu Google (induktif).

Lingkungan game dapat digunakan untuk memahami perilaku sehingga ada batasan yang lebih sedikit. Perilaku orang akan diamati secara langsung dalam aksi permainan, yang, asalkan perilaku ini merupakan refleksi wajar dari perilaku yang benar, akan memberi kita data baru. Karena ini adalah dunia virtual, bukan dunia nyata di mana Guncangan dikendalikan dan diatur, ini dapat memfasilitasi penyelesaian masalah kausalitas dan identifikasi dalam menanggapi guncangan, termasuk Guncangan politik.

Sudah ada permainan yang melibatkan beberapa orang dan ekonomi primitif yang memungkinkan barang dan uang berpindah tangan di antara para peserta. Ini termasuk EVE Online dan World of Warcraft. Beberapa ekonom telah mulai menggunakan teknologi game untuk memahami perilaku.52 (52 - Misalnya, Lehdonvirta dan Castronova (2014) Misalnya, Stephen Levitt (dari Freakonomics fame) menggunakan platform game untuk memahami kurva permintaan barang virtual.53 (53 - Levitt et al (2016)

Idenya di sini adalah menggunakan permainan dinamis dengan beberapa orang untuk mempelajari perilaku dalam ekonomi virtual. Ini akan mencakup interaksi pemain - misalnya, munculnya narasi populer yang membentuk pengeluaran atau tabungan. Dan ini mungkin termasuk reaksi pemain terhadap campur tangan dalam politik - misalnya, reaksi mereka terhadap kebijakan moneter dan peraturan. Memang, dalam peran yang terakhir, permainan dapat berfungsi sebagai bangku tes untuk tindakan politik - kelompok fokus digital, skala besar, dinamis.54 (54 - Yanis Varoufakis sebelumnya telah terlibat dengan ide yang sama: uk.businessinsider.com/yanis-varoufakis-valve -gameeconomy-greek-finance-2015-2 )

Spesialis kecerdasan buatan menciptakan lingkungan virtual untuk mempercepat proses mempelajari dinamika sistem. "Belajar dengan penguatan" memungkinkan algoritma untuk belajar dan memperbarui berdasarkan interaksi antara pemain virtual daripada pengalaman historis yang terbatas 55 (55 - Lihat deepmind.com/blog/deep-reinforcement-learning untuk diskusi) Setidaknya Pada prinsipnya, ekonomi virtual memungkinkan politisi untuk berpartisipasi dalam pelatihan penguatan mereka sendiri, mempercepat proses penemuan mereka tentang perilaku sistem ekonomi dan keuangan yang kompleks.

Kesimpulan


Jadi akankah big data menepati janji mereka? Saya yakin itu akan terjadi. Ekonomi dan keuangan perlu terus berinvestasi dalam data besar dan analitik data untuk menyeimbangkan skala metodologis. Dan studi awal, termasuk di bank, menunjukkan bahwa pengembalian kegiatan tersebut bisa tinggi, memperdalam pemahaman kita tentang ekonomi dan sistem keuangan.

Hasil-hasil ini akan lebih baik diperoleh jika kolaborasi erat dilakukan antara otoritas statistik, pembuat kebijakan, sektor komersial, pusat penelitian dan akademisi. Bank Inggris dapat memainkan peran katalisator dalam menyatukan keahlian ini. DAFM dapat melakukan hal yang sama. Saya berharap setiap keberhasilan DAFM dan berharap dapat bekerja sama dengan Anda.

Referensi
Abad, J, Aldasoro, I, Aymanns, C, D»Errico, M, Rousová, L F, Hoffmann, P, Langfield, S, Neychev, M and Roukny, T (2011), «Shedding light on dark markets: First insights from the new EU-wide OTC derivatives dataset», ESRB Occasional Paper Series, No. 11.

Albertazzi, U, Becker, B and Boucinha, M (2018), «Portfolio rebalancing and the transmission of largescale asset programmes: evidence from the euro area», ECB Working Paper Series, No. 2125.

Ali, R, Haldane, A and Nahai-Williamson, P (2012), «Towards a common financial language», paper available at www.bankofengland.co.uk/paper/2012/towards-a-common-financial-language
Anderson, C (2008), «The End of Theory: The Data Deluge Makes The Scientific Method Obsolete», Wired Magazine, 23 June.

Anson, M, Bholat, D, Kang, M and Thomas, R (2017), «The Bank of England as lender of last resort: new historical evidence from daily transactional data», Bank of England Staff Working Paper, No. 691.

Bacon, F (1620), Novum Organum.

Bagehot, W (1873), Lombard Street: A Description of the Money Market, Henry S. King & Co.

Bahaj, S, Foulis, A and Pinter, G (2017), «Home values and firm behaviour», Bank of England Staff Working Paper, No. 679.

Bank of England and Procyclicality Working Group (2014), «Procyclicality and structural trends in investment allocation by insurance companies and pension funds», Discussion Paper, July.

Baptista, R, Farmer, JD, Hinterschweiger, M, Low, K, Tang, D and Uluc, A (2016), «Macroprudential policy in an agent-based model of the UK housing market», Bank of England Staff Working Paper, No. 619.

Bean, C (2016), «Independent Review of UK Economic Statistics», available at www.gov.uk/government/publications/independent-review-of-uk-economic-statistics-final-report
Benetton, M, Bracke, P and Garbarino, N (2018), «Down payment and mortgage rates: evidence from equity loans», Bank of England Staff Working Paper, No. 713.

Bholat, D, Brookes, J, Cai, C, Grundy, K and Lund, J (2017), «Sending firm messages: text mining letters from PRA supervisors to banks and building societies they regulate, Bank of England Staff Working Paper, No. 688.

Bholat, D, Hansen, S, Santos, P and Schonhardt-Bailey, C (2015), «Text mining for central banks», Bank of England Centre for Central Bank Studies Handbook.

Bonollo, M, Crimaldi, I, Flori, A, Gianfanga, L and Pammolli, F (2016), «Assessing financial distress dependencies in OTC markets: a new approach using trade repositories data», Financial Markets and Portfolio Management, Vol. 30, No. 4, pp. 397-426.

Bracke, P and Tenreyro, S (2016), «History dependence in the housing market», Bank of England Staff Working Paper, No. 630.

Carney, M (2015), speech at Launch Conference for One Bank Research Agenda, available at www.bankofengland.co.uk/speech/2015/one-bank-research-agenda-launch-conference

Cavallo, A and Rigobon, R (2016), «The Billion Prices Project: Using Online Prices for Measurement and Research», Journal of Economic Perspectives, Vol. 30, No. 2, pp. 151-78.

Chakraborty, C, Gimpelewicz, M and Uluc, A (2017), «A tiger by the tail: estimating the UK mortgage market vulnerabilities from loan-level data, Bank of England Staff Working Paper, No. 703.

Chakraborty, C and Joseph, A (2017), «Machine learning at central banks», Bank of England Staff Working Paper, No. 674.

Cielenska, O, Joseph, A, Shreyas, U, Tanner, J and Vasios, M (2017), «Gauging market dynamics using trade repository data: the case of the Swiss franc de-pegging», Bank of England Financial Stability Paper, No. 41.

Cœuré, B (2017), «Policy analysis with big data», speech at the conference on «Economic and Financial Regulation in the Era of Big Data».

Coyle, D (2014), GDP: A Brief but Affectionate History, Princeton University Press.

Duffie, D, Gârleanu, N and Pedersen, L (2005), «Over-the-Counter Markets», Econometrica, Vol. 73, No.6, pp. 1815-1847.

Dwoskin, E (2015), «New Report Puts Numbers on Data Scientist Trend», Wall Street Journal, 7 October.

Economist (2017), «The world»s most valuable resource is no longer oil, but data», article on 6 May 2017.

Ericsson (2017), Ericsson Mobility Report, November 2017.

Farrell, D and Wheat, C (2015), «Profiles of Local Consumer Commerce», JPMorgan Chase & Co. Institute.

Financial Stability Board (2010), «Implementing OTC Derivatives Market Reforms», Financial Stability Board.

Fouquet, R and Broadberry, S (2015), «Seven Centuries of European Economic Growth and Decline», Journal of Economic Perspectives, Vol. 29, No. 4, pp. 227-244.

Ginsberg, J, Hohebbi, M, Patel, R, Brammer, L, Smolinski, M and Brilliant, L (2009), «Detecting influenza epidemics using search engine data», Nature, Vol. 457, pp. 1012-1014.

Goldsmith-Pinkham, P, Hirtle, B and Lucca, D (2016), «Parsing the Content of Bank Supervision», Federal Reserve Bank of New York Staff Reports, No. 770.

Haldane, A (2016), «The Dappled World», speech available at www.bankofengland.co.uk/speech/2016/the-dappled-world

Haldane, A and McMahon, M (forthcoming), «Central Bank Communication and the General Public», American Economic Review: Papers & Proceedings.

Henderson, V, Storeygard, A and Weil, D (2011), «A Bright Idea for Measuring Economic Growth», American Economic Review: Papers & Proceedings, Vol. 101, No. 3, pp. 194-99.

Henke, N, Bughin, J, Chui, M, Manyika, J, Saleh, T, Wiseman, B and Sethupathy, G (2016), «The Age of Analytics: Competing in a Data-Driven World», McKinsey Global Institute.

IMF (2018), «Cyclical Upswing, Structural Change», World Economic Outlook, April 2018.

Lagos, R, Rocheteau, G and Weill, P-O (2011), «Crises and liquidity in over-the-counter markets», Journal of Economic Theory, Vol. 146, No. 6, pp. 2169-2205.

Lazer, D, Kennedy, R, King, G and Vespignani, A (2014), «The Parable of Google Flu: Traps in Big Data Analysis», Science, Vol. 343, pp. 1203-1205.

Leamer, E (1983), «Let»s Take the Con Out of Econometrics», American Economic Review, Vol. 73, No. 1, pp. 31-43.

Lehdonvirta, V and Castronova, E (2014), Virtual Economies: Design and Analysis, MIT Press.

Levitt, S, List, J, Neckermann, S and Nelson, D (2016), «Quantity discounts on a virtual good: The results of a massive pricing experiment at Kind Digital Entertainment», Proceedings of the National Academy of Sciences of the United States of America, Vol. 113, No. 27, pp. 7323-7328.

Moore, G (1965), «Cramming more components onto integrated circuits», Electronics, Vol. 38, No. 8.

Nyman, R, Kapadia, S, Tuckett, D, Gregory, D, Ormerod, P and Smith, R (2018), «News and narratives in financial systems: exploiting big data for systemic risk assessment», Bank of England Staff Working Paper, No. 704.

Obstfeld, M and Rogoff, K (2001), «The Six Major Puzzles in International Macroeconomics: Is There a Common Cause?», NBER Macroeconomics Annual, Vol. 15, MIT Press.

Popper, K (1934), Logik der Forschung, Akademie Verlag.

Popper, K (1959), The Logic of Scientific Discovery, Routledge.

Rotemberg, J (1984), «Interpreting the Statistical Failures of Some Rational Expectations Models», American Economic Review, Vol. 74, No. 2, pp. 188-193.

Sabouni, H (2018), «The Rhythm of Markets», mimeo.

Schonhardt-Bailey, C (2013), Deliberating American Monetary Policy: A Textual Analysis, MIT Press.

Schwab, K (2017), The Fourth Industrial Revolution, Portfolio Penguin.

Shiller, R (2017), «Narrative Economics», American Economic Review, Vol. 104, No. 4, pp. 967-1004.

SINTEF (2013), «Big Data, for better or worse: 90% of world»s data generated over last two years», ScienceDaily, 22 May.

Stiglitz, J (2018), «Where modern macroeconomics went wrong», Oxford Review of Economy Policy, Vol. 34, No. 1-2, pp. 70-106.

Tuckett, D and Nyman, R (2017), «The relative sentiment shift series for tracking the economy», mimeo.

Turrell, A, Speigner, B, Thurgood, J, Djumalieva, J and Copple, D (forthcoming), «Using Online Vacancies to Understand the UK Labour Market from the Bottom-Up», Bank of England Staff Working Paper.

All Articles