Mitos teknologi semantik

Dalam teks sebelumnya, The Myth of the Semantic Web , sebuah upaya dilakukan untuk membuktikan gagasan bahwa web semantik, dalam kerangka solusi teknologi yang awalnya diusulkan oleh para pendirinya, akan tetap menjadi mimpi. Meskipun alat semantik W3C sendiri bukan tanpa cicit, dengan file fine-tuning, mereka cukup berhasil digunakan untuk memodelkan ontologi dalam proyek-proyek perusahaan.

Sekarang mari kita coba berurusan dengan mitos yang dapat didengar ketika membahas pendekatan semantik, bahkan dari para profesional.

Jadi, mitos utama teknologi, yang disebut semantik, teknologi, yang, menurut para pendirinya, dirancang untuk membuat komputer memahami konten (makna) teks atau karakter individu, adalah pernyataan bahwa semantik IT ada hubungannya dengan makna. Dan untuk mengenali kejadian ini, cukup disadari bahwa beralih ke format berbeda untuk merekam fakta, ke skema organisasi data yang berbeda, ke cara berbeda untuk menghasilkannya tidak dapat secara mendasar mengubah esensi teknologi informasi - komputer, seperti yang saya tidak pernah pahami, masih tidak memahami maknanya. karakter yang diproses secara terprogram. Menulis data dari basis data relasional sebagai seperangkat kembar tiga tidak menambah arti. Mengganti tabel dengan grafik dapat berguna untuk menyatukan model data, menerapkan pencarian kompleks, memodifikasi model bisnis dengan aman, dll.,tapi itu tidak akan membuat komputer mengerti arti dari data.

Satu-satunya kasus ketika diizinkan, meskipun dalam tanda kutip, untuk menggunakan frasa "pemahaman makna" adalah ketika membahas pertukaran data antara aplikasi independen. Kita dapat mengatakan bahwa penggunaan format perekaman tunggal (RDF) dan kamus seragam memberi komputer kemampuan untuk "memahami arti" data dari penyedia yang tidak dikenal. Meskipun jelas bahwa tidak perlu berbicara tentang pemahaman apa pun: masalah tanpa syarat penting tetapi pada dasarnya mencocokkan namespace, menggunakan pengidentifikasi yang sama untuk data dari jenis yang sama sedang diselesaikan (kami hanya menyetujui nama kolom).

Penggunaan yang disebut URI sebagai pengidentifikasi suatu entitas atau tipenya tidak menambah makna. Kecuali tautan "akal sehat" yang ditambahkan ke deskripsi entitas. Meskipun, sekali lagi, ini tidak ada hubungannya dengan semantik, ditafsirkan sebagai "pemahaman komputer tentang makna"; di sini kita hanya berbicara tentang kenyamanan memvisualisasikan data untuk manusia. Selain itu, dalam dokumentasi elektronik sistem TI apa pun, deskripsi entitas harus dikaitkan dengan pengidentifikasi mereka dalam repositori.

Mitos ini juga merupakan pernyataan bahwa teknologi semantik, tidak seperti teknologi tradisional, bekerja dengan pengetahuan. Lagi pula, sekali lagi, jelas bahwa mengubah struktur penyimpanan dan pemrosesan data tidak membuat pengetahuan terbaru. Tentu saja, dapat diterima untuk memanggil repositori semantik yang berisi deskripsi paling lengkap tentang bidang studi tertentu sebagai grafik pengetahuan. Tetapi pada saat yang sama, kita harus memahami bahwa kita tidak berurusan dengan pengetahuan dalam arti yang bermakna, tetapi dengan sejumlah besar fakta terkait yang membuatnya nyaman untuk melakukan pencarian. Dan di sini harus dicatat bahwa dibandingkan dengan tabel relasional dalam grafik tidak ada koneksi data tambahan, khusus - transfer data dari satu skema ke skema lainnya tidak meningkatkan jumlah tautan. Format semantik hanya menyederhanakan penciptaan hubungan baru,artinya, ini memungkinkan Anda untuk menambahkan tipe data baru ke grafik tanpa ada perubahan pada struktur penyimpanan. Tapi ini lagi-lagi kenyamanan teknologi, dan bukan alasan untuk membicarakan "data terkait" khusus (Data Terkait).

Dan tentu saja, pernyataan bahwa ontologi komputer mampu menghasilkan pengetahuan baru tidak menimbulkan apa-apa selain senyuman Ya, dengan bantuan inferensi logis yang dihasilkan oleh program risoner khusus, pernyataan baru dapat diperoleh dalam ontologi. Tetapi logika kesimpulan ini sebanding dengan kesimpulan seorang anak berusia tiga tahun "kakek adalah ayah ayahku." Tentu saja, kesimpulan logis seperti itu diperlukan untuk pencarian lanjutan, tetapi Anda harus mengakui bahwa ia tidak dapat menghasilkan pengetahuan baru secara prinsip, ia hanya dapat menyimpan data yang tidak perlu (misalnya, ia tidak perlu menganggap setiap ayah bahwa ia juga menjadi kakek pada saat kelahiran anaknya) anak). Dan di sini lagi, Anda harus memperhatikan fakta bahwa tidak ada yang mengganggu dengan cara yang sama untuk memperoleh "pengetahuan baru" dalam aplikasi dengan basis data relasional:tambahkan kolom untuk atribut "kakek" dan secara terprogram mengontrol penambahan fakta kelahiran anak. Menggunakan pendekatan ontologis hanya menyatukan operasi inferensi logis, menyederhanakan penambahan aksioma baru, memungkinkan untuk menyimpannya dalam format yang sama dengan data, tetapi tidak menambahkan "kecerdasan" ke dalamnya.

Jadi, teknologi semantik sama sekali bukan tentang semantik. Mereka adalah tentang penyatuan, standardisasi, identifikasi, modifikasi sejumlah besar data heterogen, tentang pertukaran data antara aplikasi independen, tentang pencarian yang kompleks ... Tapi bukan tentang arti dan bukan tentang pengetahuan baru. Sebaliknya, mereka tidak lebih tentang makna dan pengetahuan baru daripada teknologi lain untuk menyimpan dan memproses data. Namun, Anda tidak boleh menganggap temuan ini sebagai panggilan untuk meninggalkan terminologi yang sudah mapan - biarkan teknologinya tetap semantik, grafiklah grafik pengetahuan, dan data yang terkait (Data Terkait). Anda hanya perlu memahami apa yang bisa Anda ajarkan pada komputer dan apa yang tidak.

(Bersambung)

All Articles