Mitos web semantik

Di bidang pemodelan semantik, situasi yang agak aneh telah berkembang: seperangkat standar dan spesifikasi dari W3C yang digunakan untuk proyek "web semantik" (RDF / OWL, SPARQL, dll.) Digunakan sebagai dasar, meskipun proyek itu sendiri tidak hanya tidak diimplementasikan pada saat ini, tetapi dan, tampaknya, tidak akan pernah terwujud karena keraguan dari hipotesis asli.

Web semantik dianggap oleh penulisnya Tim Berners Lee sebagai tahap selanjutnya dalam pengembangan Internet. Idenya cukup rasional: Anda perlu menghubungkan semua sumber daya jaringan bukan dengan tautan yang tidak berarti yang mengirim pengguna dari satu halaman ke halaman lain, tetapi dengan koneksi (semantik) yang bermakna. Untuk ini, diusulkan untuk menetapkan setiap entitas online dan bahkan offline (objek, properti) pengidentifikasi unik dan menggabungkan entitas ini ke dalam satu grafik. Setelah itu, pengguna dapat dengan cepat dan akurat menemukan informasi yang mereka butuhkan, dan yang paling penting, komputer akan mendapatkan akses ke konten semantik jaringan. Yaitu, tujuannya adalah untuk membuat grafik pengetahuan terdistribusi yang menghubungkan data yang ditentukan secara semantik dalam ruang jaringan tunggal, dengan kemungkinan pemrosesan mesin dan inferensi logis dari fakta-fakta baru.

Gagasan jaringan semantik yang dijelaskan di atas terlihat tidak hanya relevan, relevan, tetapi juga cukup layak menggunakan teknologi modern - seperti jaringan peer-to-peer dengan algoritma konsensus tahan serangan, identifikasi pengguna kriptografi dan perlindungan data kriptografi. Tetapi para pendiri proyek tersebut pada awalnya membuat keputusan arsitektur dan ideologis yang meragukan yang membuat web semantik berstatus mimpi indah.

Karena tujuan utama membuat web semantik adalah berbagi informasi di Internet, Internet ini dipilih sebagai platform teknologi proyek, yaitu tumpukan kacau situs yang kontennya dikontrol bukan oleh penulis, tetapi oleh pemilik domain. Orientasi ke jaringan modern telah menentukan prinsip-prinsip dasar proyek: (1) menggunakan alamat Internet sebagai dasar untuk pengidentifikasi sumber daya (URI), (2) siapa pun dapat membuat pernyataan tentang sumber daya apa pun, (3) asumsi dunia terbuka, mis. informasi. Prinsip-prinsip ini adalah masalah utama.

Pertama-tama, jelas bahwa alamat Internet bukanlah sesuatu yang dapat berfungsi sebagai dasar untuk mengidentifikasi entitas. Sebuah domain dapat mengubah pemiliknya, dapat ditinggalkan, dan itu tidak tersedia secara teknis. Struktur nama dalam suatu domain dapat diubah secara sewenang-wenang. Belum lagi bahwa banyak teknologi dan mesin yang beragam, atas dasar di mana situs dibangun, tidak mematuhi standar apa pun untuk pembentukan alamat.

Tetapi alasan formal utama untuk kegagalan proyek web semantik harus diakui sebagai prinsip dasar kedua, yaitu, harapan bahwa pemilik situs akan membangun grafik semantik jaringan tunggal. Meskipun bahkan pada awal ide proyek, jelas bahwa pemilik situs web akan melakukan pemalsuan untuk menipu robot pencarian (hingga menulis teks yang tidak terlihat pada halaman dan memanipulasi kata kunci). Di antara mereka yang jujur ​​ingin melakukan markup semantik halaman, hanya sedikit yang akan mengatasi tugas itu. Tetapi bahkan dalam kasus yang ideal, jika jaringan semantik telah dilemparkan secara kompeten di semua situs yang ada, proyek itu masih belum akan berfungsi. Setelah semua, maka yang jelas akan terungkap: kita berhadapan dengan ratusan dan ribuan duplikat dari sumber daya yang sama (teks, gambar,video) dengan pengidentifikasi (alamat) yang berbeda. Dan di samping itu, sebagian besar contoh dari satu entitas tidak akan memiliki sifat yang sama, karena "siapa pun memiliki hak untuk membuat pernyataan tentang sumber daya apa pun." Jelas bahwa tidak mungkin menemukan salinan asli di antara salinan-salinan ini.

Dan tentu saja, masalah besar muncul dengan prinsip ketiga, memproklamirkan anggapan dunia terbuka, yaitu, menyiratkan kemungkinan penambahan fakta secara gratis ke jaringan umum. Mari kita bahas lebih detail.

Bahkan, ide dunia terbuka diwarisi dari internet standar, di mana setiap orang bebas untuk menambahkan domain, halaman, entitas, dan tautan ke entitas lain. Tetapi grafik semantik berbeda dari jaringan tautan karena harus membangun hubungan logis, idealnya dapat diverifikasi secara formal, antara pernyataan tentang entitas, dan oleh karena itu, agar konsisten, harus ditutup. Penyusun grafik semantik, memodelkan fragmen tertentu dari area subjek, harus melanjutkan dari skema konseptual yang ketat di mana ambiguitas terminologi, keunikan pengidentifikasi dan, apalagi, penambahan pernyataan sewenang-wenang oleh setiap aktor pada dasarnya tidak dapat diterima. Yaitu, jika kita berbicara tentang keterbukaan dunia yang logis,maka keterbukaan ini harus menyiratkan penambahan bebas model tertutup baru ke grafik, daripada fakta yang sewenang-wenang. Jaringan harus terdiri dari ontologi subjek dan level independen, interaksi di antaranya dipastikan dengan penggunaan kamus umum. Penting untuk memisahkan secara ketat dua tugas: (1) membangun ontologi area subjek dan (2) menyelesaikan masalah interaksi / korelasi ontologi yang berbeda, yaitu mencocokkan pengidentifikasi entitas, nama jenis, dan batasan logis untuk mengoordinasikan pertukaran data.(1) membangun ontologi dari domain subjek, dan (2) menyelesaikan masalah interaksi / korelasi ontologi yang berbeda, yaitu, mencocokkan pengidentifikasi entitas, jenis penamaan, dan kendala logis untuk mengoordinasikan pertukaran data.(1) membangun ontologi area subjek, dan (2) menyelesaikan masalah interaksi / korelasi ontologi yang berbeda, yaitu, mencocokkan pengidentifikasi entitas, jenis penamaan, dan kendala logis untuk mengoordinasikan pertukaran data.

Ini juga harus diakui sebagai keputusan yang salah dan orientasi proyek web semantik untuk menciptakan satu-satunya grafik yang benar dan konsisten yang dibangun sesuai dengan kanon logika formal (monoton). Seseorang masih bisa setuju dengan pendekatan ini ketika membangun basis pengetahuan tetap di beberapa bidang studi yang praktis diselesaikan (geografi, standar teknik, dll.). Namun, alat pemodelan ontologi diperlukan tidak untuk menggambarkan struktur statis, tetapi untuk mendukung berfungsinya sistem kompleks nyata di mana monotonitas dan konsistensi deskripsi tidak dapat dicapai tidak hanya selama pembentukannya, tetapi juga dalam keadaan akhir. Perlu diakui bahwa terjadinya kesalahan dalam membangun sistem adalah fakta yang mengubah keadaannya, dan mengabaikan fakta ini dapat menyebabkan konsekuensi yang membawa malapetaka.Artinya, logika grafik semantik tidak boleh monoton. Dan di sini harus diingat bahwa penulis gagasan web semantik bukan satu-satunya yang menginjak menyapu ontologi tunggal - setelah bertahun-tahun mencoba membangun ruang semantik yang konsisten, proyek CYC yang terkenal meninggalkan ide ini dan beralih ke bekerja dengan mikrotheories - ontologi lokal yang ditutup pada area subyek individu.

Bahkan, kesalahan dalam mendesain alat web semantik adalah bahwa perbedaan antara kedua tugas tidak diidentifikasi dan diperhitungkan. Yang pertama adalah penciptaan ontologi lokal dari domain: menambahkan pernyataan divalidasi oleh lokal (offline dan online) berarti ke dalamnya, derivasi logis dari pernyataan baru sesuai dengan aturan yang dibangun ke dalam ontologi lokal. Yang kedua adalah koneksi ontologi lokal ke dalam grafik jaringan tunggal dan upaya untuk mendapatkan kesimpulan dari berbagai data independen. Jelas, bahkan jika semua sumber data jaringan menggunakan kamus yang sama dan masing-masing dari mereka secara logis sempurna, jawaban yang diterima untuk pertanyaan ke grafik agregat (jika mungkin) akan memiliki status keandalan yang secara fundamental berbeda dibandingkan dengan hasil yang diperoleh di setiap ontologi lokal.

Perbedaan yang dijelaskan dalam bekerja dengan ontologi lokal dan grafik semantik umum dapat secara formal dinyatakan dalam hal keterbukaan dunia: permintaan ke jaringan harus didasarkan pada anggapan keterbukaan dunia, dan logika bekerja dengan ontologi lokal akan paling sering didasarkan pada hipotesis dunia-tertutup. Kita dapat mengatakan bahwa dunia harus terbuka, tetapi tidak untuk pernyataan individu, tetapi untuk ontologi holistik.

Jadi ternyata standar W3C terus dikembangkan untuk web semantik mitos, dan semua orang yang mencoba menggunakannya dalam proyek nyata, yaitu, untuk membuat ontologi bidang studi, dipaksa untuk terus-menerus menghasilkan kruk untuk mendapatkan produk yang berfungsi.

(Lanjutan mitos teknologi semantik ).

All Articles