Sistemas digitales semánticos

En el texto anterior ( Mitos de la tecnología semántica ) no fue sin compartir la conmoción que se afirmó que no hay semántica en la semántica de TI. Aunque, por supuesto, debe responder por separado dos preguntas: (1) ¿los datos contienen significado? y (2) ¿entiende la computadora este significado? Dejaremos la segunda pregunta a los filósofos, aunque la respuesta ya es obvia. La respuesta a la primera también es obvia: se necesitan sistemas de información para procesar la información, es decir, datos significativos y semánticamente definidos. En este caso, por supuesto, debe entenderse que estos datos son significativos solo para la persona que inicialmente produce estos datos, escribe un programa para su procesamiento y finalmente percibe su significado.

Los diferentes sistemas de TI se relacionan de manera diferente con el contenido de datos. Hay aplicaciones que son indiferentes al significado, es decir, procesan los datos, ignorando por completo su contenido. Estos incluyen los programas más simples que funcionan con texto, sonido e imagen. Sus algoritmos no se centran en el contenido de los archivos procesados. Al editor de texto no le importa si el contrato comercial, el artículo científico o la tarea del estudiante de la escuela están cargados.

El resto de los sistemas de TI son sensibles a la semántica, es decir, de alguna manera reaccionan al contenido de los datos. Dichos sistemas, a diferencia de los sistemas del primer tipo, almacenan datos no en archivos "uniformes", sino en forma de matrices estructuradas con un desglose en tipos y valores. Esta misma estructura de datos debería estar asociada con la semántica. Además, debe tenerse en cuenta que hay dos formas de especificar la semántica de los datos: (1) a través de la arquitectura del sistema, por ejemplo, utilizando la estructura de las tablas de la base de datos, y (2) configurando los datos en sí. Es decir, la semántica de los datos está rígidamente determinada por la estructura de la aplicación, o puede ser independiente de la aplicación cosida en los propios datos. Y la segunda forma de estructurar datos, cuando el modelo de datos está determinado por los datos en sí, es lo que llamamos semántica.

Por lo tanto, se debe resaltar un tipo especial de sistemas de TI que funcionan con un formato de datos semántico especial. La principal característica distintiva de los sistemas semánticos es que los algoritmos de procesamiento de datos no se definen por la arquitectura de la aplicación (estructura de la base de datos o código del programa), sino por los datos en sí: los valores de los datos, su tipificación y las relaciones lógicas se escriben en forma de una matriz de declaraciones de formato uniforme. Es decir, por un lado, tenemos un formato con el que los datos se describen a sí mismos, su semántica y, por otro, aplicaciones universales que procesan datos de semántica arbitraria, siempre que correspondan al formato. Y aquí, de hecho, es tentador decir que los sistemas semánticos entienden el significado de los datos, aunque, por supuesto, solo deberíamos hablar sobre la distinción formal de un significado de otro,sin ninguna comprensión de la computadora.

Aquí, por supuesto, debe tenerse en cuenta que en este momento, los sistemas semánticos aún no han alcanzado completamente el nivel de sus competidores no semánticos. Hasta ahora, el marcado semántico le permite corregir solo una estructura de datos estática: para describir entidades, propiedades, individuos, valores de propiedad de individuos, establecer relaciones subordinadas entre entidades y también establecer las reglas para derivar nuevas declaraciones. Es decir, el sistema semántico moderno es esencialmente un almacén de datos universal con la capacidad de implementar búsquedas complejas y generar nuevos datos, de acuerdo con los axiomas y las reglas contenidas en los datos mismos. Además, el almacenamiento puede ser distribuido (red) o local. Para una felicidad completa en la tecnología, no hay suficiente especificación de una descripción de acciones, es decir, un método para incorporar modelos de procesos de negocios en datos semánticos.

Intentemos resaltar las ventajas de los sistemas semánticos en relación con los estándares y las condiciones necesarias para la realización de estas ventajas (la descripción no hace referencia a ningún estándar).

En primer lugar, los sistemas semánticos son aplicaciones universales que no están vinculadas rígidamente a las áreas temáticas. Para trabajar con varios modelos de datos, la aplicación no necesita hacer ningún cambio; solo es necesario describir la estructura del área temática utilizando lenguajes especiales, es decir, crear su ontología y cargar la ontología junto con los datos reales en la aplicación. Además, la estructura de datos en cualquier momento puede modificarse libremente, complementada con nuevos conceptos, relaciones, reglas.

Obviamente, las aplicaciones semánticas son generalmente más lentas que aquellas cuya estructura de datos y algoritmos están codificados en el código. Sin embargo, hay muchos procesos comerciales para los que la velocidad de su modelado y la capacidad de modificar modelos libremente son más importantes que la velocidad de la aplicación.

Las ventajas más importantes de la tecnología semántica incluyen la automatización del intercambio de datos. Gracias al formato de descripción de datos universal, las aplicaciones independientes pueden interactuar libremente. Para implementar completamente esta característica, se deben cumplir dos condiciones: (1) las aplicaciones usan diccionarios únicos que contienen definiciones de entidad, y (2) las aplicaciones admiten identificación de entidad única, lo que evita colisiones. Los diccionarios deben estar en formato de datos semánticos y sus elementos también deben tener identificadores únicos. Como resultado, tenemos la oportunidad del uso colectivo de ontologías y el intercambio de datos gratuito (sin ninguna API).

La presentación semántica de los datos, es decir, la combinación de una serie de datos objetivos y su esquema conceptual, le permite implementar opciones de búsqueda complejas teniendo en cuenta todo tipo de condiciones y dependencias. Además, la búsqueda puede ser realizada no solo por el repositorio de ontología local, sino también por una variedad de aplicaciones en la red.

Por lo tanto, la tarea principal de las tecnologías semánticas es la unificación del trabajo con datos para optimizar la construcción de modelos simbólicos de áreas temáticas, automatizar el intercambio de datos entre aplicaciones independientes y refinar la búsqueda de datos. El problema se resuelve: (1) la inclusión de metadatos en los datos en sí, (2) la unificación del formato de datos, (3) la introducción de una identificación única de datos, (4) la estandarización de diccionarios y reglas de salida.

Continúa Semántica y Actividades

All Articles