Kode Voynich: Kemenangan imajiner Kecerdasan Buatan

Bidang minat untuk karyawan dan guru sekolah bahasa Inggris online EnglishDom jauh lebih luas daripada hanya bahasa Inggris. Misteri linguistik juga menarik bagi kita. Baru-baru ini, sebuah kontroversi muncul di kantor kami tentang kode Voynich, dan kami memutuskan untuk membuat artikel tentang topik ini.



Naskah Voynich adalah salah satu misteri linguistik dan kriptografi yang paling membara, yang hingga kini belum terpecahkan. Selama 600 tahun, bahkan pikiran terbaik di dunia tidak dapat mendekati untuk mengungkap teks misterius ini.

Pada 2016, para peneliti menghubungkan jaringan saraf ke solusi. Hasilnya tidak terduga - komputer menganalisis teks dan membuat kesalahan. Baca lebih lanjut tentang ini.

Naskah Voynich adalah kode tulisan tangan bergambar yang ditulis dalam bahasa atau kode yang tidak dikenal.

Menurut hasil analisis karbon, buku itu ditulis pada paruh pertama abad ke-15. 240 halaman perkamen ditutupi dengan huruf-huruf aneh yang terlihat seperti teks. Tetapi kesulitan mengartikannya adalah bahwa buku tersebut menggunakan alfabet yang tidak diketahui yang tidak berkorelasi dengan bahasa yang ada atau dipelajari yang ada.

Analisis terperinci dari teks memungkinkan kita untuk menentukan bahwa surat-surat mematuhi aturan tata bahasa tertentu, tetapi aturan itu sendiri tidak dapat ditentukan. Praktis tidak ada kata satu atau dua huruf dalam teks, yang banyak dalam bahasa berbasis Latin, prinsip-prinsip individu menulis kata-kata yang jauh menyerupai tulisan Arab atau bahasa Ibrani. Kata-kata individual umumnya diulang beberapa kali berturut-turut. Secara umum, struktur bahasa atau sandi tidak dapat ditentukan secara kasar - terlalu berbeda dari semua prinsip penulisan bahasa tertulis yang kita ketahui.

Satu-satunya hal yang dapat ditentukan oleh para ahli linguistik selama hampir 600 tahun adalah bahwa entropi informasi kode kurang lebih sama dengan entropi bahasa Inggris dan Latin. Ini berarti bahwa teks tersebut jelas bukan kumpulan karakter acak, tetapi membawa makna tertentu.

Secara teori, ini bahkan bisa dienkripsi dalam bahasa Inggris, tetapi bagaimana kita bisa mengetahui apakah para peneliti masih tidak dapat menentukan apakah naskah itu sendiri adalah sandi atau hanya beberapa bahasa yang aneh?

Bahkan dengan kunci, menguraikan prinsip-prinsip bahasa membutuhkan upaya luar biasa dari pihak ahli bahasa. Memahami batu Rosetta membutuhkan waktu 20 tahun bagi para peneliti. Dan ini asalkan mereka tahu salah satu dari tiga bahasa di mana teks ditulis dalam batu.

Bayangkan saja, bahkan setelah mengetahui terjemahan teks Yunani kuno, para peneliti membutuhkan lebih dari dua dekade untuk menguraikan teks yang sama yang ditulis dalam tulisan hieroglif. Surat demotik itu diuraikan sebelumnya, tetapi sangat mengejutkan bahwa fakta bahwa memiliki kunci, esensi bahasa telah terurai begitu lama.


Naskah Voynich juga berisi fragmen pendek dari teks, yang tersingkir dari total. Pisahkan kata-kata yang ditulis dalam huruf Latin dengan kombinasi karakter yang tidak dikenal.

Namun, prasasti ini dienkripsi atau ditulis sesuai dengan aturan bahasa yang tidak dikenal. Karena tidak mungkin menerjemahkannya. Bagaimanapun, para peneliti mengatakan demikian.

Teori tentang decoding naskah Voynich


Selama 600 tahun, para peneliti telah mengumpulkan banyak teori tentang asal mula bahasa dan alfabet buku ini. Ada beberapa yang agak aneh, beberapa layak diperhatikan.

Sebagian besar sarjana hingga abad ke-20 percaya bahwa naskah Voynich hanya menyembunyikan salah satu bahasa Eropa dengan cara khusus .

Tetapi teks tidak sesuai dengan sandi yang ada di abad ke-15. Substitusi, cipher polyalphabetic, nomenclator, dan homophonic tidak cocok.

Ada kemungkinan bahwa teks dienkripsi dengan salah satu dari sandi di atas, dan kemudian rumit menggunakan karakter dan spasi palsu atau tingkat enkripsi lain, tetapi hipotesis ini sangat sulit untuk diverifikasi - karena dalam kasus ini tidak mungkin untuk melacak karakter mana yang salah dan mana yang benar .

Hipotesis populer kedua menyatakan bahwa kode Voynich adalah sandi codebook yang umum . Artinya, kombinasi karakter yang terpisah adalah kata yang terpisah dalam bahasa yang ada. Memang, bentuk naskah menunjukkan bahwa teks memiliki makna yang sangat pasti. Tetapi hari ini tidak mungkin untuk mengkonfirmasi atau membantah hipotesis ini - untuk memecahkan sandi semacam itu hanya mungkin dilakukan dengan bantuan kamus.

Beberapa peneliti percaya bahwa naskah itu ditulis dalam bahasa eksotik nyata dengan alfabet yang unik . Misalnya, dalam salah satu dialek timur atau Amerika. Beberapa fitur gaya teks mengisyaratkan ini, tetapi bukti untuk ini masih belum cukup.

Masih ada banyak pertimbangan: bahasa unik yang dibuat secara artifisial, teks terenkripsi multibahasa, bahasa proto, yang mendahului semua bahasa dari kelompok Romanesque. Bahkan ada pemikiran bahwa naskah itu ditulis oleh orang gila dan sama sekali tidak masuk akal. Para peneliti juga mencoba membuktikan bahwa naskah itu bohong, tetapi analisis radiokarbon masih menunjukkan bahwa buku itu benar-benar ditulis pada abad ke-15.

Tak satu pun dari hipotesis tersebut telah menerima bukti yang cukup tentang tidak bersalahnya mereka. Karenanya, kode Voynich belum terpecahkan.

Jaringan saraf sedang mencoba untuk memecahkan kode Voynich


Jadi, setelah pengantar yang luas dan luas, kita beralih ke esensi artikel. Pada 2016, mereka mencoba meretas Enigma dari dunia sastra menggunakan jaringan saraf. Ya, itu pada tahun 2016 - media belajar tentang upaya ini hanya pada tahun 2018, karena tanggal ini mereka sering bingung. Berikut ini tautan ke studi asli . Teksnya dalam bahasa Inggris, jadi Anda perlu setidaknya sedikit pemahaman tentang terminologi ilmiah.

Ilmuwan Kanada telah "melatih" jaringan saraf untuk mengenali elemen individu dari alfabet dan token dari 380 bahasa dunia yang ada atau yang sudah ada sebelumnya. Menurut para peneliti, keakuratan analisis jaringan saraf berada dalam 97%.

Sistem menunjukkan bahwa bahasa naskah yang paling mungkin adalah bahasa Ibrani. Tentu saja, bukan bahasa Ibrani sederhana, tetapi dengan sub-subskrip. Para peneliti telah menyarankan bahwa buku itu memiliki sandi yang cukup sederhana, di mana vokal dihilangkan atau dienkripsi dengan karakter lain, dan konsonan ditempatkan dalam urutan abjad atau acak.

Perlu juga dicatat bahwa sistem ini juga menyediakan sumber-sumber lain yang mungkin: Mazatec (bahasa asli dari selatan modern Meksiko), Mozarabic (bahasa Arab di Semenanjung Iberia), Italia dan Ladino (bahasa Yahudi di Semenanjung Iberia). Juga, jaringan saraf menemukan unsur-unsur standar bahasa Arab dan Amharik (wilayah Ethiopia modern, bagian dari kelompok Semitik).

Pendekatan semacam itu tiba-tiba membuahkan hasil dan jaringan saraf mampu menerjemahkan bagian dari teks buku. Frasa pertama diterjemahkan sebagai:

Dia membuat rekomendasi kepada pastor, abdi rumah dan saya dan orang-orang.
Dia memberi nasihat kepada pendeta, pemilik rumah, saya dan orang-orang.

Tampaknya, ini dia, kemenangan kecerdasan buatan! Berdasarkan interpretasi dan ilustrasi ini, para peneliti bahkan membuat asumsi bahwa naskah Voynich adalah sejenis farmakope - sebuah buku medis yang menggambarkan nilai penyembuhan tanaman herbal, metode pembuatan dan penggunaan obat-obatan, dan struktur tubuh manusia.

Secara total, algoritma "mengenali" sekitar 80% dari kata-kata dari seluruh naskah. Analisis ini didasarkan pada asumsi yang sama tentang tidak adanya vokalisasi dan urutan huruf dalam kata-kata.

Tetapi pemeriksaan berulang dari frase tes pertama menunjukkan hasil yang berbeda:

And the priest made a man for him to his house, and to his men.
, .

Unleavened bread and made her the priest, and one which leaves his home.
, , .

Ungkapan-ungkapan itu kurang masuk akal daripada versi aslinya, tetapi secara teori ini dapat dikaitkan dengan ketidaksempurnaan algoritma terjemahan sistem. Secara umum, dasar-dasar leksikal dalam semua versi terjemahan tetap tidak berubah: "imam" dan "rumah".

Orang bisa mengklaim sukses, tetapi ada beberapa "tetapi" serius yang tidak membuat hasil penelitian sensasional.

Pertama, pengaturan jaringan saraf memungkinkan kebebasan tertentu dalam penafsiran kata-kata, karena bahkan jika Anda mempertimbangkan bahwa alfabet hanyalah jenis huruf Ibrani yang diubah, ada beberapa varian kata yang dapat dibuat dengan mengatur ulang huruf-huruf tersebut.

Jika kita berasumsi bahwa bahasa naskah itu bukan bahasa Ibrani, tetapi hanya milik kelompok Semitik atau yang terkait dengannya, maka analisis yang sempurna tidak akan masuk akal - ada terlalu banyak pilihan untuk menganalisis bahkan karakter-karakter yang nilainya tampaknya telah ditentukan. Dan ada lebih banyak lagi yang tidak diketahui.

Dalam situasi ini, saya ingin mengingat teorema tentang monyet tanpa akhir. Jika ada yang belum mendengar, ini dia:

Misalkan kita memiliki jumlah monyet yang tidak terbatas dengan mesin tik, yang masing-masing secara acak mengetuk tombol untuk waktu yang tidak terbatas.

Cepat atau lambat, salah satu dari kera-kera itu akan dapat "menipu" teks arbitrer apa pun: apakah itu catatan pendek atau "War and Peace".

Teori ini dapat diterapkan jika teks ditafsirkan oleh jaringan saraf. Awalnya, jaringan saraf itu sendiri menciptakan kumpulan varian makna setiap kata, dan kemudian dari seluruh kumpulan varian itu memilih interpretasi yang paling mungkin berdasarkan kombinasi dengan varian tetangga.

Akibatnya, dalam kalimat 5-8 kata diduga kita mendapatkan beberapa puluh ribu opsi, di mana jaringan saraf memilih salah satu yang paling bermakna.

Artinya, ada kemungkinan yang sangat tinggi bahwa di antara opsi-opsi yang berbeda ini secara tidak sengaja akan ada satu atau lebih yang benar-benar masuk akal. Selain itu, jika ada cipher yang lebih kompleks atau struktur kalimat atau kata-kata leksikal lainnya, maka metode tersebut ternyata salah positif.

Bahkan, ada beberapa hasil, itu bisa "dirasakan" dan disajikan kepada publik, tetapi tidak ada gunanya, karena tidak mengambil langkah lebih dekat ke solusi nyata dari cipher.

Dan secara obyektif menggabungkan gaya huruf alfabet dengan bahasa Ibrani adalah solusi yang agak tidak biasa. Namun, sebagian besar sarjana naskah ragu bahwa bahasa asli naskah itu adalah bahasa Ibrani. Struktur leksikal tidak bertepatan cukup kuat, dan masih tidak mungkin untuk menganalisis tingkat enkripsi, jika ada.

Selain itu, beberapa percaya bahwa ahli bahasa dengan jaringan saraf tidak melakukan analisis objektif, tetapi mencari konfirmasi dari teori yang terpisah. Hipotesis bahwa buku ini adalah farmakope dapat dibuat berdasarkan gambar tumbuhan, manusia, dan tubuh bintang, bahkan tanpa menganalisis teks.

Akibatnya, hasil penelitian tidak diterima di komunitas ilmiah. Karena mereka tidak mengungkapkan fitur spesifik dan prinsip-prinsip bahasa, sebagaimana diperlukan untuk studi linguistik lengkap dari kata keterangan. Agar hasil penelitian dapat dikenali, ada kekurangan bukti yang klise. Tidak mungkin untuk melacak rantai logis yang jelas yang memandu jaringan saraf selama analisis, sehingga hasilnya tidak dapat dianggap sehat secara ilmiah - ada kemungkinan tidak nol bahwa rantai tersebut ternyata salah.

Namun, tidak ada hipotesis yang lebih memadai tentang naskah Voynich.

Ahli bahasa mencoba, tetapi mereka semua terlihat lebih seperti lelucon. Sebagai contoh, pada tahun 2019, seorang ilmuwan Inggris menyatakan bahwa ia telah memecahkan kode Voynich. Tetapi teori “bahasa Protoromanian” atau bahasa Latin vulgar dikritik tajam oleh para sarjana yang menuduh Inggris secara artifisial memilih kata-kata tanpa mendefinisikan prinsip-prinsip penulisan dan tanpa argumen meyakinkan tentang hubungan leksikal antara makna.

Sekarang sudah tahun 2020 dan hype di sekitar "hanya dan benar decoding naskah Voynich" telah berhenti. Dia masih terus dianggap sebagai salah satu teka-teki linguistik dan kriptologis utama di zaman kita.

Tentu saja, saya ingin percaya bahwa suatu hari nanti mereka akan menyelesaikannya semua sama. Jika ini semacam bahasa, maka sepenuhnya mungkin. Tetapi jika ini masih berupa sandi dengan kunci yang hilang, maka manuskrip itu berisiko selamanya hanya berupa buku kuno yang indah dengan sejarah yang misterius.

Secara umum, teka-teki linguistik adalah topik yang sangat keren. Teka-teki silang dan teka-teki - ini hanya puncak gunung es - ada begitu banyak cara untuk secara bersamaan belajar bahasa Inggris dan memompa logika dan pemikiran. Guru Bahasa Inggris sering menggunakannya di kelas untuk mendiversifikasi proses pembelajaran dan membuatnya lebih menarik.

EnglishDom.com sekolah online - menginspirasi Anda untuk belajar bahasa Inggris melalui teknologi dan perawatan manusia




Hanya untuk pembaca Habr pelajaran pertama dengan guru di Skype gratis ! Dan saat Anda membeli kelas, dapatkan hingga 3 pelajaran sebagai hadiah!

Dapatkan langganan premium sebulan penuh untuk aplikasi ED Words secara gratis .
Masukkan kode promosi Voynich di halaman ini atau langsung di aplikasi ED Words . Kode promosi ini berlaku hingga 01/30/2021.

Produk kita:

Source: https://habr.com/ru/post/undefined/


All Articles