Systèmes numériques sémantiques

Dans le texte précédent ( Mythes de la technologie sémantique ), ce n'était pas sans part de choc qu'il était dit qu'il n'y a pas de sémantique dans la sémantique informatique. Bien sûr, vous devez répondre séparément à deux questions: (1) les données contiennent-elles un sens? et (2) l'ordinateur comprend-il cette signification? Nous laisserons la seconde question aux philosophes, bien que la réponse soit déjà évidente. La réponse à la première est également évidente: des systèmes d'information sont nécessaires pour traiter l'information, c'est-à-dire des données significatives et sémantiquement définies. Dans ce cas, bien sûr, il faut comprendre que ces données n'ont de sens que pour la personne qui produit initialement ces données, écrit un programme pour leur traitement et, finalement, perçoit leur signification.

Différents systèmes informatiques sont liés différemment au contenu des données. Il y a des applications qui sont indifférentes à la signification, c'est-à-dire qu'elles traitent les données, ignorant complètement leur contenu. Il s'agit notamment des programmes les plus simples qui fonctionnent avec du texte, du son, de l'image. Leurs algorithmes ne se concentrent pas sur le contenu des fichiers traités. L'éditeur de texte ne se soucie pas si le contrat commercial, l'article scientifique ou les devoirs de l'élève sont chargés dedans.

Les autres systèmes informatiques sont sensibles à la sémantique, c'est-à-dire qu'ils réagissent en quelque sorte au contenu des données. De tels systèmes, contrairement aux systèmes du premier type, stockent les données non pas dans des fichiers «lisses», mais sous la forme de tableaux structurés avec une répartition en types et valeurs. Cette structure même de données devrait être associée à la sémantique. En outre, il convient de noter qu'il existe deux façons de spécifier la sémantique des données: (1) à travers l'architecture du système, par exemple, en utilisant la structure des tables de base de données, et (2) en configurant les données elles-mêmes. Autrement dit, la sémantique des données est soit déterminée de manière rigide par la structure de l'application, soit elle peut être indépendante de l'application cousue dans les données elles-mêmes. Et la deuxième façon de structurer les données, lorsque le modèle de données est déterminé par les données elles-mêmes, est ce que nous appelons sémantique.

Ainsi, un type spécial de systèmes informatiques fonctionnant avec un format de données sémantique spécial doit être mis en évidence. La principale caractéristique distinctive des systèmes sémantiques est que les algorithmes de traitement des données ne sont pas spécifiés par l'architecture de l'application (structure de la base de données ou code de programme), mais par les données elles-mêmes: les valeurs des données, leur typification et les relations logiques sont écrites sous la forme d'un tableau d'instructions de format uniforme. C'est-à-dire, d'une part, nous avons un format avec lequel les données se décrivent, leur sémantique, et d'autre part, des applications universelles qui traitent des données de sémantique arbitraire, à condition qu'elles correspondent au format. Et ici, en effet, il est tentant de dire que les systèmes sémantiques comprennent la signification des données, bien que, bien sûr, nous ne devrions parler que de la distinction formelle d'une signification d'une autre,sans aucune compréhension de l'ordinateur.

Ici, bien sûr, il convient de noter qu'à l'heure actuelle, les systèmes sémantiques n'ont pas encore pleinement atteint le niveau de leurs concurrents non sémantiques. Jusqu'à présent, le balisage sémantique vous permet de corriger uniquement une structure de données statique: pour décrire les entités, les propriétés, les individus, les valeurs des propriétés des individus, établir des relations subordonnées entre les entités et également définir les règles pour dériver de nouvelles instructions. Autrement dit, le système sémantique moderne est essentiellement un entrepôt de données universel avec la capacité de mettre en œuvre une recherche complexe et de générer de nouvelles données, selon les axiomes et les règles contenues dans les données elles-mêmes. De plus, le stockage peut être distribué (réseau) ou local. Pour un bonheur technologique complet, il n'y a pas suffisamment de spécification d'une description des actions, c'est-à-dire une méthode d'intégration des modèles de processus métier dans les données sémantiques.

Essayons de mettre en évidence les avantages des systèmes sémantiques par rapport aux systèmes standards et les conditions nécessaires à la réalisation de ces avantages (la description ne fait référence à aucune norme).

Tout d'abord, les systèmes sémantiques sont des applications universelles qui ne sont pas liées de manière rigide aux domaines. Pour travailler avec différents modèles de données, l'application n'a pas besoin d'apporter de modifications; il suffit de décrire la structure du domaine à l'aide de langages spéciaux, c'est-à-dire de créer son ontologie et de charger l'ontologie avec les données réelles dans l'application. De plus, la structure des données à tout moment peut être librement modifiée, complétée par de nouveaux concepts, relations, règles.

De toute évidence, les applications sémantiques sont généralement plus lentes que celles dont la structure des données et les algorithmes sont codés en dur dans le code. Cependant, il existe de nombreux processus métier pour lesquels la vitesse de leur modélisation et la possibilité de modification gratuite des modèles sont plus importantes que la vitesse de l'application.

Les avantages les plus importants de la technologie sémantique comprennent l'automatisation de l'échange de données. Grâce au format universel de description des données, les applications indépendantes peuvent interagir librement. Pour implémenter pleinement cette fonctionnalité, deux conditions doivent être remplies: (1) les applications utilisent des dictionnaires uniques contenant des définitions d'entité et (2) les applications prennent en charge l'identification d'entité unique, ce qui empêche les collisions. Les dictionnaires doivent être au format de données sémantiques et leurs éléments doivent également avoir des identifiants uniques. En conséquence, nous avons la possibilité d'utiliser collectivement des ontologies et d'échanger des données gratuitement (sans aucune API).

La présentation sémantique des données, c'est-à-dire la combinaison dans un tableau de données factuelles et leur schéma conceptuel, vous permet d'implémenter des options de recherche complexes prenant en compte toutes sortes de conditions et de dépendances. De plus, la recherche peut être effectuée non seulement par le référentiel d'ontologie local, mais également par une variété d'applications sur le réseau.

Ainsi, la tâche principale des technologies sémantiques est l'unification du travail avec les données afin d'optimiser la construction de modèles symboliques de domaines, d'automatiser l'échange de données entre applications indépendantes et d'affiner la recherche de données. Le problème est résolu: (1) l'inclusion de métadonnées dans les données elles-mêmes, (2) l'unification du format des données, (3) l'introduction d'une identification unique des données, (4) la normalisation des dictionnaires et des règles de sortie. Sémantique et activités

continues

All Articles