Sistemas Digitais Semânticos

No texto anterior ( Mitos da tecnologia semântica ), não foi sem partes de choque que se afirmou que não há semântica na semântica de TI. Embora, é claro, você precise responder separadamente a duas perguntas: (1) os dados contêm significado? e (2) o computador entende esse significado? Vamos deixar a segunda pergunta para os filósofos, embora a resposta já seja óbvia. A resposta para a primeira também é óbvia: são necessários sistemas de informação para processar informações, isto é, dados significativos, semanticamente definidos. Nesse caso, é claro, é preciso entender que esses dados são significativos apenas para a pessoa que os produz inicialmente, escreve um programa para seu processamento e, finalmente, percebe seu significado.

Diferentes sistemas de TI se relacionam de maneira diferente com o conteúdo dos dados. Existem aplicativos indiferentes ao significado, ou seja, eles processam os dados, ignorando completamente seu conteúdo. Isso inclui os programas mais simples que funcionam com texto, som e imagem. Seus algoritmos não se concentram no conteúdo dos arquivos processados. O editor de texto não se importa se o contrato comercial, o artigo científico ou a lição de casa do aluno da escola estiver carregado nele.

Os demais sistemas de TI são sensíveis à semântica, ou seja, eles reagem de alguma forma ao conteúdo dos dados. Esses sistemas, diferentemente dos sistemas do primeiro tipo, armazenam dados não em arquivos "suaves", mas na forma de matrizes estruturadas com uma discriminação em tipos e valores. Essa mesma estrutura de dados deve ser associada à semântica. Além disso, deve-se notar que existem duas maneiras de definir a semântica dos dados: (1) através da arquitetura do sistema, por exemplo, usando a estrutura da tabela do banco de dados e (2) configurando os próprios dados. Ou seja, a semântica dos dados é determinada rigidamente pela estrutura do aplicativo ou pode ser independente do aplicativo incorporado nos próprios dados. E a segunda maneira de estruturar dados, quando o modelo de dados é determinado pelos próprios dados, é o que chamamos de semântica.

Portanto, um tipo especial de sistema de TI que opera com um formato de dados semântico especial deve ser destacado. A principal característica distintiva dos sistemas semânticos é que os algoritmos de processamento de dados são especificados não pela arquitetura do aplicativo (estrutura do banco de dados ou código do programa), mas pelos próprios dados: os valores dos dados, sua tipificação e relações lógicas são gravados na forma de uma matriz de instruções uniformes no formato. Ou seja, por um lado, temos um formato com o qual os dados se descrevem, sua semântica e, por outro, aplicativos universais que processam dados da semântica arbitrária, desde que correspondam ao formato. E aqui, de fato, é tentador dizer que os sistemas semânticos entendem o significado dos dados, embora, é claro, devamos falar apenas sobre a distinção formal de um significado de outro,sem qualquer entendimento do computador.

Aqui, é claro, deve-se notar que, no momento, os sistemas semânticos ainda não atingiram completamente o nível de seus concorrentes não-semânticos. Até agora, a marcação semântica permite corrigir apenas uma estrutura de dados estática: descrever entidades, propriedades, indivíduos, valores de propriedades de indivíduos, estabelecer relacionamentos subordinados entre entidades e também definir regras para derivar novas instruções. Ou seja, o sistema semântico moderno é essencialmente um data warehouse universal com a capacidade de implementar pesquisa complexa e gerar novos dados, de acordo com os axiomas e regras contidos nos próprios dados. Além disso, o armazenamento pode ser distribuído (rede) ou local. Para total felicidade na tecnologia, não há especificação suficiente de uma descrição das ações, ou seja, um método de incorporação de modelos de processos de negócios nos dados semânticos.

Vamos tentar destacar as vantagens dos sistemas semânticos em relação aos sistemas padrão e as condições necessárias para a realização dessas vantagens (a descrição não faz referência a nenhum padrão).

Em primeiro lugar, os sistemas semânticos são aplicativos universais que não estão rigidamente vinculados às áreas de assunto. Para trabalhar com vários modelos de dados, o aplicativo não precisa fazer alterações; é necessário apenas descrever a estrutura da área de assunto usando linguagens especiais, ou seja, criar sua ontologia e carregar a ontologia junto com os dados reais no aplicativo. Além disso, a estrutura de dados a qualquer momento pode ser livremente modificada, complementada por novos conceitos, relacionamentos, regras.

Obviamente, aplicativos semânticos geralmente são mais lentos do que aqueles cuja estrutura de dados e algoritmos são codificados no código. No entanto, existem muitos processos de negócios para os quais a velocidade de sua modelagem e a capacidade de modificar livremente os modelos são mais importantes que a velocidade do aplicativo.

As vantagens mais importantes da tecnologia semântica incluem a automação da troca de dados. Graças ao formato universal de descrição de dados, aplicativos independentes podem interagir livremente. Para implementar totalmente esse recurso, duas condições devem ser atendidas: (1) os aplicativos usam dicionários únicos contendo definições de entidade e (2) os aplicativos oferecem suporte à identificação exclusiva da entidade, o que evita colisões. Os dicionários devem estar no formato de dados semânticos e seus elementos também devem ter identificadores exclusivos. Como resultado, temos a oportunidade de uso coletivo de ontologias e troca de dados gratuita (sem API).

A apresentação semântica de dados, isto é, combinando uma matriz de dados factuais e seu esquema conceitual, permite implementar opções de pesquisa complexas, levando em consideração todos os tipos de condições e dependências. Além disso, a pesquisa pode ser conduzida não apenas pelo repositório de ontologia local, mas também por uma variedade de aplicativos na rede.

Portanto, a principal tarefa das tecnologias semânticas é a unificação do trabalho com os dados, a fim de otimizar a construção de modelos simbólicos de áreas temáticas, automatizar a troca de dados entre aplicativos independentes e refinar a busca por dados. O problema está resolvido: (1) a inclusão de metadados nos próprios dados, (2) a unificação do formato dos dados, (3) a introdução de uma identificação única dos dados, (4) a padronização de dicionários e regras de saída. Semântica e atividades

contínuas

All Articles