Les mythes de la technologie sémantique

Dans le texte précédent, Le mythe du Web sémantique , une tentative a été faite pour justifier l'idée que le Web sémantique, dans le cadre des solutions technologiques proposées à l'origine par ses fondateurs, resterait un rêve. Bien que les outils sémantiques du W3C eux-mêmes ne soient pas sans grincement, avec un fichier de réglage fin, ils sont assez bien utilisés pour modéliser les ontologies dans les projets d'entreprise.

Essayons maintenant de faire face aux mythes qui peuvent être entendus lorsque nous discutons de l'approche sémantique, même de la part de professionnels.

Ainsi, le mythe principal de la technologie, qui est appelé sémantique, la technologie, qui, selon ses fondateurs, est conçue pour faire comprendre à l'ordinateur le contenu (sens) des textes ou des caractères individuels, est l'affirmation même que la sémantique informatique a quelque chose à voir avec le sens. Et pour reconnaître cet incident, il suffit de se rendre compte que le passage à un format différent pour l'enregistrement des faits, à un autre schéma d'organisation des données, à une autre façon de les générer ne peut pas fondamentalement changer l'essence des technologies de l'information - l'ordinateur, comme je ne l'ai jamais compris, ne comprend toujours pas le sens caractères traités par programmation. L'écriture de données à partir d'une base de données relationnelle sous la forme d'un ensemble de triplets n'ajoute aucun sens. Le remplacement de tableaux par un graphique peut être utile pour unifier un modèle de données, mettre en œuvre des recherches complexes, modifier en toute sécurité des modèles commerciaux, etc.,mais cela ne fera pas comprendre à l'ordinateur la signification des données.

Le seul cas où il est permis, quoique entre guillemets, d'utiliser l'expression «compréhension du sens» est lors de l'examen de l'échange de données entre des applications indépendantes. Nous pouvons dire que l'utilisation d'un format d'enregistrement unique (RDF) et de dictionnaires uniformes donne à l'ordinateur la capacité de «comprendre la signification» des données d'un fournisseur inconnu. Bien qu'il soit évident qu'il n'est pas nécessaire de parler de compréhension non plus: le problème inconditionnellement important mais essentiellement banal de faire correspondre l'espace de noms, l'utilisation des mêmes identifiants pour les données du même type est en train d'être résolu (nous sommes juste d'accord sur les noms des colonnes).

L'utilisation de ce que l'on appelle les URI comme identifiant d'une entité ou de son type n'ajoute pas de sens. Sauf en tant que tel, un lien «ajout de sens» à la description de l'entité. Bien que, encore une fois, cela n'a rien à voir avec la sémantique, interprétée comme «la compréhension informatique des significations»; ici, nous ne parlons que de la commodité de visualiser les données pour les humains. De plus, dans la documentation électronique de tout système informatique, la description des entités est nécessairement associée à leurs identifiants dans le référentiel.

Le mythe est également une déclaration selon laquelle les technologies sémantiques, contrairement aux technologies traditionnelles, fonctionnent avec la connaissance. Après tout, encore une fois, il est évident que la modification de la structure du stockage et du traitement des données ne fait pas appel aux dernières connaissances. Bien sûr, il est parfaitement acceptable d'appeler un référentiel sémantique contenant la description la plus complète d'un domaine donné sous forme de graphe de connaissances. Mais en même temps, nous devons comprendre que nous n'avons pas affaire à des connaissances dans un sens, mais à un large éventail de faits connexes qui facilitent la conduite d'une recherche. Et ici, il convient de noter qu'en comparaison avec les tables relationnelles du graphique, il n'y a pas de connexion de données spéciale supplémentaire - le transfert de données d'un schéma à un autre n'augmente pas le nombre de liens. Le format sémantique ne fait que simplifier la création de nouvelles relations,c'est-à-dire qu'il vous permet d'ajouter de nouveaux types de données au graphique sans aucune modification de la structure de stockage. Mais c'est là encore une commodité technologique, et non une raison de parler de «données liées» spéciales (données liées).

Et bien sûr, l'affirmation selon laquelle les ontologies informatiques sont capables de générer de nouvelles connaissances ne provoque rien d'autre qu'un sourire. Oui, à l'aide de l'inférence logique produite par les programmes spéciaux de risoner, de nouvelles déclarations peuvent être obtenues dans l'ontologie. Mais la logique de cette conclusion est comparable au niveau de la conclusion d'un enfant de trois ans «le grand-père est le père de mon père». Bien sûr, une telle conclusion logique est nécessaire pour une recherche avancée, mais vous devez admettre qu'il ne peut pas générer de nouvelles connaissances en principe, il ne peut enregistrer que des données inutiles (par exemple, il n'a pas besoin d'attribuer à chaque père qu'il est également devenu grand-père au moment de la naissance de son enfant enfant). Et là encore, vous devez faire attention au fait que personne ne dérange de la même manière pour dériver de "nouvelles connaissances" dans des applications avec des bases de données relationnelles:ajouter une colonne pour l'attribut "grand-père" et contrôler par programmation l'ajout du fait de la naissance d'un enfant. L'utilisation de l'approche ontologique ne fait qu'unifier les opérations d'inférence logique, simplifie l'ajout de nouveaux axiomes, permet de les stocker dans le même format que les données, mais n'y ajoute aucune «intelligence».

Ainsi, la technologie sémantique ne concerne pas du tout la sémantique. Il s'agit d'unification, de standardisation, d'identification, de modification d'un large éventail de données hétérogènes, d'échange de données entre applications indépendantes, de recherche complexe ... Mais pas de sens et pas de nouvelles connaissances. Il ne s'agit pas davantage de sens et de nouvelles connaissances que les autres technologies de stockage et de traitement des données. Cependant, vous ne devez pas prendre ces conclusions comme un appel à abandonner la terminologie établie - laissez la technologie rester sémantique, le graphe un graphe de connaissances et les données connectées (données liées). Vous avez juste besoin de comprendre ce que vous pouvez enseigner à un ordinateur et ce qui ne l'est pas.

(À suivre)

All Articles