Semantische digitale Systeme

Im vorherigen Text ( Mythen der semantischen Technologie ) wurde nicht ohne Schock festgestellt, dass es in der IT-Semantik keine Semantik gibt. Obwohl Sie natürlich zwei Fragen getrennt beantworten müssen: (1) Enthalten die Daten eine Bedeutung? und (2) versteht der Computer diese Bedeutung? Wir werden die zweite Frage den Philosophen überlassen, obwohl die Antwort darauf bereits offensichtlich ist. Die Antwort auf die erste Frage liegt ebenfalls auf der Hand: Informationssysteme werden benötigt, um Informationen zu verarbeiten, dh aussagekräftige, semantisch definierte Daten. In diesem Fall muss man natürlich verstehen, dass diese Daten nur für die Person von Bedeutung sind, die diese Daten anfänglich erstellt, ein Programm für ihre Verarbeitung schreibt und letztendlich ihre Bedeutung wahrnimmt.

Unterschiedliche IT-Systeme beziehen sich unterschiedlich auf Dateninhalte. Es gibt Anwendungen, denen die Bedeutung gleichgültig ist, dh sie verarbeiten die Daten und ignorieren ihren Inhalt vollständig. Dazu gehören die einfachsten Programme, die mit Text, Ton und Bild arbeiten. Ihre Algorithmen konzentrieren sich nicht auf den Inhalt verarbeiteter Dateien. Dem Texteditor ist es egal, ob der Geschäftsvertrag, der wissenschaftliche Artikel oder die Hausaufgaben des Schülers darin geladen sind.

Die verbleibenden IT-Systeme reagieren empfindlich auf Semantik, dh sie reagieren irgendwie auf den Inhalt der Daten. Solche Systeme speichern Daten im Gegensatz zu Systemen des ersten Typs nicht in „glatten“ Dateien, sondern in Form von strukturierten Arrays mit einer Aufteilung in Typen und Werte. Diese Datenstruktur sollte mit der Semantik verknüpft werden. Ferner sollte beachtet werden, dass es zwei Möglichkeiten gibt, die Semantik von Daten anzugeben: (1) durch die Architektur des Systems, beispielsweise unter Verwendung der Struktur der Datenbanktabellen, und (2) durch Konfigurieren der Daten selbst. Das heißt, die Semantik der Daten wird entweder starr durch die Struktur der Anwendung bestimmt oder kann unabhängig von der in die Daten selbst eingebetteten Anwendung sein. Und die zweite Art der Datenstrukturierung, wenn das Datenmodell durch die Daten selbst bestimmt wird, nennen wir Semantik.

Daher sollte ein spezieller Typ von IT-Systemen hervorgehoben werden, die mit einem speziellen semantischen Datenformat arbeiten. Das Hauptunterscheidungsmerkmal semantischer Systeme besteht darin, dass die Datenverarbeitungsalgorithmen nicht durch die Anwendungsarchitektur (Datenbankstruktur oder Programmcode) definiert werden, sondern durch die Daten selbst: Datenwerte, ihre Typisierung und logische Beziehungen werden in Form eines Arrays von Anweisungen geschrieben, die im Format einheitlich sind. Das heißt, wir haben einerseits ein Format, mit dem die Daten sich selbst, ihre Semantik beschreiben, und andererseits universelle Anwendungen, die Daten beliebiger Semantik verarbeiten, sofern sie dem Format entsprechen. Und hier ist es in der Tat verlockend zu sagen, dass semantische Systeme die Bedeutung von Daten verstehen, obwohl wir natürlich nur über die formale Unterscheidung einer Bedeutung von einer anderen sprechen sollten,ohne Verständnis vom Computer.

Hierbei ist natürlich zu beachten, dass semantische Systeme derzeit noch nicht vollständig das Niveau ihrer nicht-semantischen Konkurrenten erreicht haben. Bisher können Sie mit semantischem Markup nur eine statische Datenstruktur festlegen: Entitäten, Eigenschaften, Personen, Eigenschaftswerte von Personen beschreiben, untergeordnete Beziehungen zwischen Entitäten herstellen und Regeln für die Ableitung neuer Anweisungen festlegen. Das heißt, das moderne semantische System ist im Wesentlichen ein universelles Data Warehouse mit der Fähigkeit, komplexe Suchvorgänge zu implementieren und neue Daten gemäß den in den Daten selbst enthaltenen Axiomen und Regeln zu generieren. Darüber hinaus kann der Speicher entweder verteilt (Netzwerk) oder lokal sein. Für ein vollständiges technologisches Glück gibt es nicht genügend Spezifikationen für eine Beschreibung von Aktionen, dh eine Methode zum Einbetten von Geschäftsprozessmodellen in die semantischen Daten.

Versuchen wir, die Vorteile semantischer Systeme gegenüber Standardsystemen und die Bedingungen hervorzuheben, die für die Realisierung dieser Vorteile erforderlich sind (die Beschreibung bezieht sich nicht auf Standards).

Erstens sind semantische Systeme universelle Anwendungen, die nicht starr an Themenbereiche gebunden sind. Um mit verschiedenen Datenmodellen arbeiten zu können, muss die Anwendung keine Änderungen vornehmen. Sie muss lediglich die Struktur des Themenbereichs in speziellen Sprachen beschreiben, dh ihre Ontologie erstellen und die Ontologie zusammen mit den tatsächlichen Daten in die Anwendung laden. Darüber hinaus kann die Datenstruktur jederzeit frei geändert werden, ergänzt durch neue Konzepte, Beziehungen, Regeln.

Offensichtlich sind semantische Anwendungen im Allgemeinen langsamer als solche, deren Datenstruktur und Algorithmen im Code fest codiert sind. Es gibt jedoch viele Geschäftsprozesse, für die die Geschwindigkeit ihrer Modellierung und die Fähigkeit, Modelle frei zu ändern, wichtiger sind als die Geschwindigkeit der Anwendung.

Zu den wichtigsten Vorteilen der semantischen Technologie gehört die Automatisierung des Datenaustauschs. Dank des universellen Datenbeschreibungsformats können unabhängige Anwendungen frei interagieren. Um diese Funktion vollständig zu implementieren, müssen zwei Bedingungen erfüllt sein: (1) Anwendungen verwenden einzelne Wörterbücher, die Entitätsdefinitionen enthalten, und (2) Anwendungen unterstützen die eindeutige Entitätsidentifikation, wodurch Kollisionen verhindert werden. Wörterbücher müssen im semantischen Datenformat vorliegen und ihre Elemente müssen außerdem eindeutige Bezeichner haben. Als Ergebnis erhalten wir die Möglichkeit der gemeinsamen Nutzung von Ontologien und des kostenlosen Datenaustauschs (ohne API).

Die semantische Darstellung von Daten, dh die Kombination eines Arrays von Faktendaten und ihres konzeptionellen Schemas, ermöglicht es Ihnen, komplexe Suchoptionen unter Berücksichtigung aller Arten von Bedingungen und Abhängigkeiten zu implementieren. Darüber hinaus kann die Suche nicht nur vom lokalen Ontologie-Repository, sondern auch von einer Vielzahl von Anwendungen im Netzwerk durchgeführt werden.

Die Hauptaufgabe semantischer Technologien ist es daher, die Arbeit mit Daten zu vereinheitlichen, um die Konstruktion symbolischer Modelle von Themenbereichen zu optimieren, den Datenaustausch zwischen unabhängigen Anwendungen zu automatisieren und die Suche nach Daten zu verfeinern. Das Problem ist gelöst: (1) die Aufnahme von Metadaten in die Daten selbst, (2) die Vereinheitlichung des Datenformats, (3) die Einführung einer eindeutigen Identifizierung von Daten, (4) die Standardisierung von Wörterbüchern und Ausgaberegeln.

Fortsetzung Semantik und Aktivitäten

All Articles