Mitos Data Besar dan Budaya Digital



Kami terus menerbitkan laporan paling menarik dari RAIF , forum tahunan tentang kecerdasan buatan yang diselenggarakan oleh Jet Infosystems. Hari ini kami ingin berbagi kisah Boris Asenovich Novikov, dokter ilmu fisika dan matematika, profesor di departemen ilmu komputer HSE.

Mitos Data Besar dan Budaya Digital


Kata besar dalam kasus kami lebih mengacu pada mitos daripada data, jadi saya akan menceritakan terutama tentang yang pertama, tetapi dalam konteks yang terakhir. Karena saya telah berpura-pura bekerja di komunitas ilmiah selama beberapa dekade, saya akan mulai dengan mendefinisikannya agar terlihat seperti pengetahuan yang akurat.


Mitos adalah bagian integral dari budaya masyarakat, mereka selalu ada dan terus muncul di dunia modern. Saya memberi contoh:


Bagian yang lebih tua dari audiens harus mengingat kebisingan sekitar tahun 2000, yang sebenarnya merupakan salah satu dari 400 cara yang relatif jujur โ€‹โ€‹untuk mengambil uang dari pelanggan, tidak lebih. Tentu saja, bencana itu tidak terjadi saat itu.

Banyak mitos muncul seputar rekayasa perangkat lunak - ada banyak sudut pandang yang berbeda, dan saya tidak akan berkonsentrasi pada topik ini sekarang.

Inisiatif dari atas mendorong saya ke laporan ini: di universitas tempat saya bekerja, ada kebutuhan untuk mengajarkan literasi digital kepada semua orang, dari TK hingga sekolah pascasarjana. Tidak ada yang tahu apa itu, dan saya terburu-buru mengakui kepada manajemen bahwa saya kira-kira mengerti bagaimana melakukannya ... dan tertangkap. Itu perlu untuk mempelajari spesialisasi yang berbeda dalam satu program:


Kontribusi utama saya untuk masalah ini adalah saya mengganti nama kursus ini dari Digital Literacy ke Digital Culture.

Di salah satu konferensi internasional, saya mendengar pernyataan ini: untuk menarik perhatian audiens, Anda perlu menambahkan setidaknya beberapa petunjuk seksualitas ke dalam laporan, dan karenanya: beberapa tahun yang lalu di media (khususnya, di Rusia) kasus ini dibahas secara luas. seorang siswi Amerika mulai mengirim iklan untuk wanita hamil (konteks seksual dari cerita berakhir di sini), kemudian keluarga mengajukan gugatan, tetapi pada akhirnya gugatan itu harus ditarik ... Karena gadis itu ternyata benar-benar hamil. Sejarah telah membuat banyak kebisingan, kata mereka, para analis ini tahu lebih banyak tentang kita daripada diri kita sendiri (ini tidak mungkin)! Semua ini sangat berbahaya, dan perlu untuk memperkuat pertahanan. Maka lahirlah mitos:

  1. Data besar sangat berbahaya
  2. Mereka tahu lebih banyak tentang kita daripada diri kita sendiri.
  3. Diperlukan langkah-langkah keamanan tambahan

Jangan salah paham: keselamatan itu penting, tetapi mari kita lihat bagaimana cara mengevaluasi kasus ini secara profesional.


Kesimpulan apa yang bisa dibuat? Analisis TERKADANG dapat menghasilkan hasil yang tepat, dan kami juga dapat mengatakan bahwa kadang-kadang kami tidak tahu apa-apa.

Teman dan kolega saya memperhatikan fakta bahwa pengiriman acak terkadang juga memberikan hasil yang benar, dan kami tidak dapat mengatakan apa pun tentang kualitas pengiriman kecuali kami mengevaluasi indikator kuantitatif apa pun. Pertama-tama, perlu untuk mengevaluasi kelengkapan dan akurasi.

Jenis-jenis mitos berikut yang saya pinjam dari konteks asing. Misalnya, di salah satu konferensi pemrosesan data SIGMOD 2019, ada diskusi panel (atau, seperti yang kita katakan, tabel bundar) pada topik "Ilmu Data Bertanggung Jawab". Mereka membahas contoh bagaimana penggunaan alat analisis data yang tidak bertanggung jawab, pembelajaran mesin, dll. Sebagai salah satu contoh, mereka mengutip kisah menentukan jenis kelamin seseorang dari foto-foto mata. Orang-orang mengerjakan ini selama beberapa tahun, mencapai akurasi sebanyak 80%, sampai seorang skeptis menemukan bahwa sebenarnya mereka menentukan ada atau tidaknya kosmetik.

Ini adalah keingintahuan, tetapi di sini adalah contoh di mana bahayanya benar-benar nyata: kita berbicara tentang menggunakan metode pembelajaran mesin untuk mengidentifikasi penjahat dari foto. Ternyata, dalam prinsip kerja sistem pembelajaran ini, ada masalah dengan kebenaran politik: pertama, mereka memberikan jawaban positif palsu dengan frekuensi berbeda tergantung pada ras, dan kedua, ternyata kemudian, pada kenyataannya, mereka menentukan ada atau tidaknya senyuman. foto, tidak lebih. Namun, ada upaya untuk menggunakan sistem ini, dan petugas yang seharusnya menggunakan hasilnya, jika terjadi perselisihan, seharusnya menulis penjelasan tertulis tentang mengapa mereka tidak setuju dengan hasil yang dihasilkan sistem. Ini adalah contoh bagaimana mitos bisa berbahaya bagi masyarakat.


Untuk beberapa alasan kita berbicara Ilmu Data, meskipun kita berbicara tentang aplikasi industri. Di semua bidang lain - Ilmu Komputer, tapi ... Rekayasa Perangkat Lunak. Persamaan fisika matematika dan semacam jembatan, atau yang lainnya? Kolega, ilmuwan tidak bisa dipercaya! Saya ingin berpikir bahwa Ilmu Data milik bagian "Ilmu", dan sayangnya, kata-kata Teknik Data sudah diambil oleh konsep lain.

Saya kembali ke cerita dengan desain kursus untuk seluruh universitas, terlepas dari kesiapan dan spesialisasi. Gambar di sisi kanan (angsa, kanker dan tombak) menunjukkan bagaimana tim berkumpul dari perwakilan semua departemen universitas bekerja.


Namun, kami mencoba melakukan sesuatu yang masuk akal. Idenya adalah untuk menunjukkan hal-hal sederhana yang dapat dilakukan oleh setiap peneliti untuk dirinya sendiri, terlepas dari area tempat dia bekerja. Selain itu, agar dia bisa mengerti pada titik apa (ini yang paling penting!), Anda perlu menghubungi para profesional pengolah data. Saya mencoba menghindari resep semacam itu untuk pemula (tetapi sedikit yang berhasil), seperti "Jadikan panduan tambahan yang populer, tetapi tidak praktis."

Jadi, mitos tidak bisa dihindari, dan kita harus mengerti bahwa kita masih harus menghadapinya. Mitos adalah sumber dari banyak kesalahan, kegagalan, dan masalah, dan kadang-kadang bahkan bisa berbahaya - penggunaan tanpa sepengetahuan "pengetahuan" mistis dapat memiliki konsekuensi negatif.

Selain fakta bahwa kami sedang mengembangkan teknologi, perlu untuk mendidik masyarakat, dan ini adalah keprihatinan konstan yang tidak akan pernah sepenuhnya diselesaikan, karena umat manusia pada umumnya tidak berkembang secepat teknologi. Jauh lebih sulit untuk mendidik orang daripada kecerdasan buatan - salah satu sumber mitos. Kita perlu belajar bagaimana bekerja dan hidup dengannya sedemikian rupa untuk menghindari bahaya besar.

All Articles