Die Mythen der semantischen Technologie

Im vorherigen Text, Der Mythos des Semantic Web , wurde versucht, die Idee zu untermauern, dass das Semantic Web im Rahmen der ursprünglich von seinen Gründern vorgeschlagenen technologischen Lösungen ein Traum bleiben würde. Obwohl die semantischen W3C-Tools selbst mit einer Feinabstimmungsdatei nicht ohne Quietschen sind, werden sie recht erfolgreich zur Modellierung von Ontologien in Unternehmensprojekten verwendet.

Lassen Sie uns nun versuchen, mit den Mythen umzugehen, die bei der Diskussion des semantischen Ansatzes selbst von Fachleuten zu hören sind.

Der Hauptmythos der Technologie, der als semantische Technologie bezeichnet wird und laut seinen Gründern den Computer dazu bringen soll, den Inhalt (die Bedeutung) von Texten oder einzelnen Zeichen zu verstehen, ist die Aussage, dass die IT-Semantik etwas mit der Bedeutung zu tun hat. Und um diesen Vorfall anzuerkennen, genügt es zu erkennen, dass der Wechsel zu einem anderen Format für die Aufzeichnung von Fakten, zu einem anderen Schema der Datenorganisation und zu einer anderen Art ihrer Generierung das Wesen der Informationstechnologie nicht grundlegend verändern kann - der Computer versteht, wie ich nie verstanden habe, die Bedeutung immer noch nicht programmgesteuert verarbeitete Zeichen. Das Schreiben von Daten aus einer relationalen Datenbank als Triplett-Satz hat keine Bedeutung. Das Ersetzen von Tabellen durch ein Diagramm kann nützlich sein, um ein Datenmodell zu vereinheitlichen, komplexe Suchvorgänge zu implementieren, Geschäftsmodelle sicher zu ändern usw.Der Computer versteht die Bedeutung der Daten jedoch nicht.

Der einzige Fall, in dem es zulässig ist, den Ausdruck „Bedeutungsverständnis“ in Anführungszeichen zu verwenden, ist die Erörterung des Datenaustauschs zwischen unabhängigen Anwendungen. Wir können sagen, dass die Verwendung eines einzelnen Aufzeichnungsformats (RDF) und einheitlicher Wörterbücher dem Computer die Möglichkeit gibt, die Bedeutung von Daten eines unbekannten Anbieters zu „verstehen“. Obwohl es offensichtlich ist, dass auch von keinem Verständnis die Rede sein muss: Das bedingungslos wichtige, aber im Wesentlichen banale Problem des Abgleichs des Namespace mit der Verwendung derselben Bezeichner für Daten desselben Typs wird gelöst (wir stimmen nur den Spaltennamen zu).

Die Verwendung von sogenannten URIs als Bezeichner einer Entität oder ihres Typs fügt keine Bedeutung hinzu. Außer als solches ein "Sinn hinzufügen" -Link zur Beschreibung der Entität. Auch dies hat nichts mit Semantik zu tun, die als „Computerverständnis von Bedeutungen“ interpretiert wird. Hier geht es nur um die Bequemlichkeit der Visualisierung von Daten für Menschen. Darüber hinaus wird in der elektronischen Dokumentation eines IT-Systems die Beschreibung von Entitäten notwendigerweise mit ihren Kennungen im Repository verknüpft.

Der Mythos ist auch eine Aussage, dass semantische Technologien im Gegensatz zu traditionellen mit Wissen arbeiten. Schließlich ist es offensichtlich, dass eine Änderung der Struktur der Datenspeicherung und -verarbeitung nicht den neuesten Erkenntnissen entspricht. Natürlich ist es durchaus akzeptabel, ein semantisches Repository, das die vollständigste Beschreibung eines bestimmten Themenbereichs enthält, als Wissensdiagramm aufzurufen. Gleichzeitig müssen wir verstehen, dass es sich nicht um Wissen in einem sinnvollen Sinne handelt, sondern um eine Vielzahl verwandter Fakten, die es bequem machen, eine Suche durchzuführen. Und hier ist zu beachten, dass im Vergleich zu relationalen Tabellen im Diagramm keine spezielle zusätzliche Datenverbindung besteht - die Übertragung von Daten von einem Schema zu einem anderen erhöht nicht die Anzahl der Verknüpfungen. Das semantische Format vereinfacht nur die Erstellung neuer Beziehungen.Das heißt, Sie können dem Diagramm neue Datentypen hinzufügen, ohne die Speicherstruktur zu ändern. Dies ist jedoch wiederum technologischer Komfort und kein Grund, über spezielle „verwandte Daten“ (verknüpfte Daten) zu sprechen.

Und natürlich verursacht die Aussage, dass Computerontologien in der Lage sind, neues Wissen zu generieren, nichts anderes als ein Lächeln. Ja, mit Hilfe logischer Schlussfolgerungen, die von speziellen Risoner-Programmen erstellt wurden, können neue Aussagen in der Ontologie erhalten werden. Aber die Logik dieser Schlussfolgerung ist vergleichbar mit der Schlussfolgerung eines dreijährigen Kindes: "Großvater ist der Vater meines Vaters." Natürlich ist eine solche logische Schlussfolgerung für eine erweiterte Suche erforderlich, aber Sie müssen zugeben, dass er im Prinzip kein neues Wissen generieren kann, sondern nur unnötige Daten speichern kann (zum Beispiel muss er nicht jedem Vater zuschreiben, dass er zum Zeitpunkt der Geburt seines Kindes auch Großvater geworden ist Kind). Und auch hier sollten Sie darauf achten, dass sich niemand auf die gleiche Weise darum kümmert, "neues Wissen" in Anwendungen mit relationalen Datenbanken abzuleiten:Fügen Sie eine Spalte für das Attribut "Großvater" hinzu und steuern Sie programmgesteuert die Hinzufügung der Tatsache der Geburt eines Kindes. Die Verwendung des ontologischen Ansatzes vereinheitlicht nur logische Inferenzoperationen, vereinfacht das Hinzufügen neuer Axiome, ermöglicht das Speichern im gleichen Format wie Daten, fügt jedoch keine „Intelligenz“ hinzu.

Bei der semantischen Technologie geht es also überhaupt nicht um Semantik. Es geht um Vereinheitlichung, Standardisierung, Identifizierung, Modifikation einer Vielzahl heterogener Daten, um den Datenaustausch zwischen unabhängigen Anwendungen, um eine komplexe Suche ... aber nicht um die Bedeutung und um neues Wissen. Es geht vielmehr nicht mehr um Bedeutung und neues Wissen als um andere Technologien zum Speichern und Verarbeiten von Daten. Sie sollten diese Schlussfolgerungen jedoch nicht als Aufruf betrachten, die etablierte Terminologie aufzugeben - lassen Sie die Technologie semantisch bleiben, das Diagramm ein Wissensdiagramm und die verbundenen Daten (verknüpfte Daten). Sie müssen nur verstehen, was Sie einem Computer beibringen können und was nicht.

(Fortsetzung folgt)

All Articles