Los mitos de la tecnología semántica.

En el texto anterior, El mito de la web semántica , se hizo un intento para corroborar la idea de que la web semántica, en el marco de las soluciones tecnológicas propuestas originalmente por sus fundadores, seguiría siendo un sueño. Aunque las herramientas semánticas del W3C no carecen de chirrido, con un archivo de ajuste fino, se utilizan con bastante éxito para modelar ontologías en proyectos empresariales.

Ahora tratemos de lidiar con los mitos que se pueden escuchar cuando se discute el enfoque semántico, incluso de profesionales.

Entonces, el mito principal de la tecnología, que se llama semántica, tecnología que, según sus fundadores, está diseñada para hacer que la computadora entienda el contenido (significado) de los textos o caracteres individuales, es la afirmación de que la semántica de TI tiene algo que ver con el significado. Y para reconocer este incidente, es suficiente darse cuenta de que cambiar a un formato diferente para registrar hechos, a un esquema de organización de datos diferente, a una forma diferente de generarlos no puede cambiar fundamentalmente la esencia de la tecnología de la información: la computadora, como nunca entendí, todavía no entiende el significado caracteres procesados ​​programáticamente. Escribir datos de una base de datos relacional como un conjunto de tripletes no agrega ningún significado. Reemplazar tablas con un gráfico puede ser útil para unificar un modelo de datos, implementar búsquedas complejas, modificar de forma segura modelos de negocios, etc.pero no hará que la computadora entienda el significado de los datos.

El único caso cuando es permisible, aunque entre comillas, usar la frase "comprensión del significado" es cuando se discute el intercambio de datos entre aplicaciones independientes. Podemos decir que el uso de un formato de grabación único (RDF) y diccionarios uniformes le da a la computadora la capacidad de "comprender el significado" de los datos de un proveedor desconocido. Aunque es obvio que tampoco hay necesidad de hablar de ninguna comprensión: se está resolviendo el problema incondicionalmente importante pero esencialmente banal de hacer coincidir el espacio de nombres, utilizando los mismos identificadores para datos del mismo tipo (solo estamos de acuerdo con los nombres de las columnas).

El uso de los llamados URI como un identificador de una entidad o su tipo no agrega significado. Excepto como tal un enlace de "sentido agregado" a la descripción de la entidad. Aunque, de nuevo, esto no tiene nada que ver con la semántica, interpretada como "comprensión informática de los significados"; Aquí estamos hablando solo de la conveniencia de visualizar datos para humanos. Además, en la documentación electrónica de cualquier sistema de TI, la descripción de las entidades está necesariamente asociada con sus identificadores en el repositorio.

El mito también es una declaración de que las tecnologías semánticas, a diferencia de las tradicionales, funcionan con conocimiento. Después de todo, nuevamente, es obvio que cambiar la estructura del almacenamiento y procesamiento de datos no aprovecha los últimos conocimientos. Por supuesto, es perfectamente aceptable llamar a un repositorio semántico que contenga la descripción más completa de un área temática determinada como un gráfico de conocimiento. Pero al mismo tiempo, debemos entender que no estamos tratando con el conocimiento en un sentido significativo, sino con una gran variedad de hechos relacionados que hacen que sea conveniente realizar una búsqueda. Y aquí debe tenerse en cuenta que, en comparación con las tablas relacionales en el gráfico, no hay una conexión de datos adicional especial: la transferencia de datos de un esquema a otro no aumenta el número de enlaces. El formato semántico solo simplifica la creación de nuevas relaciones,es decir, le permite agregar nuevos tipos de datos al gráfico sin ningún cambio en la estructura de almacenamiento. Pero esto es nuevamente conveniencia tecnológica, y no una razón para hablar sobre "datos relacionados" especiales (Datos Vinculados).

Y, por supuesto, la afirmación de que las ontologías informáticas son capaces de generar nuevos conocimientos no causa nada más que una sonrisa. Sí, con la ayuda de la inferencia lógica producida por programas especiales de risoner, se pueden obtener nuevas afirmaciones en ontología. Pero la lógica de esta conclusión es comparable en nivel con la conclusión de un niño de tres años "el abuelo es el padre de mi papá". Por supuesto, una conclusión tan lógica es necesaria para una búsqueda avanzada, pero debe admitir que no puede generar ningún conocimiento nuevo, solo le permite no almacenar datos innecesarios (por ejemplo, no requiere atribuir a cada padre que él también se convirtió en abuelo en el momento del nacimiento de su hijo) niño). Y aquí nuevamente, debe prestar atención al hecho de que nadie se molesta de la misma manera para obtener "nuevos conocimientos" en aplicaciones con bases de datos relacionales:agregue una columna para el atributo "abuelo" y controle mediante programación la adición del hecho del nacimiento de un hijo. El uso del enfoque ontológico solo unifica las operaciones de inferencia lógica, simplifica la adición de nuevos axiomas, hace posible almacenarlos en el mismo formato que los datos, pero no agrega ninguna "inteligencia".

Entonces, la tecnología semántica no se trata de semántica en absoluto. Se trata de unificación, estandarización, identificación, modificación de una gran variedad de datos heterogéneos, sobre el intercambio de datos entre aplicaciones independientes, sobre una búsqueda compleja ... Pero no sobre el significado y no sobre nuevos conocimientos. Más bien, no tienen más que ver con el significado y el nuevo conocimiento que otras tecnologías para almacenar y procesar datos. Sin embargo, no debe tomar estas conclusiones como un llamado a abandonar la terminología establecida: deje que la tecnología permanezca semántica, el gráfico un gráfico de conocimiento y los datos conectados (Datos vinculados). Solo necesita comprender qué puede enseñarle a una computadora y qué no.

(Continuará)

All Articles