Os mitos da tecnologia semântica

No texto anterior, “ O Mito da Web Semântica ”, foi feita uma tentativa de substanciar a idéia de que a Web semântica dentro da estrutura das soluções tecnológicas originalmente propostas por seus fundadores continuaria sendo um sonho. Embora as próprias ferramentas semânticas do W3C não sejam sem ruído, com um arquivo de ajuste fino, elas são usadas com êxito para modelar ontologias em projetos corporativos.

Agora vamos tentar lidar com os mitos que podem ser ouvidos ao discutir a abordagem semântica, mesmo de profissionais.

Portanto, o principal mito da tecnologia, chamado semântica, tecnologia que, de acordo com seus fundadores, é projetado para fazer o computador entender o conteúdo (significado) de textos ou caracteres individuais, é a própria afirmação de que a semântica de TI tem algo a ver com significado. E para reconhecer esse incidente, basta perceber que mudar para um formato diferente para registrar fatos, para outro esquema de organização de dados, para outra maneira de gerá-los não pode mudar fundamentalmente a essência da tecnologia da informação - o computador, como eu nunca entendi, ainda não entende o significado caracteres processados ​​programaticamente. Escrever dados de um banco de dados relacional como um conjunto de trigêmeos não adiciona nenhum significado. A substituição de tabelas por um gráfico pode ser útil para unificar um modelo de dados, implementar pesquisas complexas, modificar com segurança modelos de negócios etc.,mas isso não fará o computador entender o significado dos dados.

O único caso em que é permitido, embora entre aspas, usar a frase "compreensão do significado" é quando se discute a troca de dados entre aplicativos independentes. Podemos dizer que o uso de um único formato de gravação (RDF) e dicionários uniformes oferece ao computador a capacidade de "entender o significado" dos dados de um provedor desconhecido. Embora seja óbvio que não há necessidade de falar de qualquer entendimento: o problema incondicionalmente importante, mas essencialmente banal, de corresponder ao espaço para nome, está sendo resolvido usando os mesmos identificadores para dados do mesmo tipo (concordamos apenas com os nomes das colunas).

O uso dos chamados URIs como identificador de uma entidade ou seu tipo não adiciona significado. Exceto como um link de "adição de sentido" à descrição da entidade. Embora, novamente, isso não tenha nada a ver com semântica, interpretada como "compreensão computacional dos significados"; aqui estamos falando apenas sobre a conveniência de visualizar dados para seres humanos. Além disso, na documentação eletrônica de qualquer sistema de TI, a descrição das entidades está necessariamente associada aos seus identificadores no repositório.

O mito também é uma afirmação de que as tecnologias semânticas, diferentemente das tradicionais, trabalham com o conhecimento. Afinal, novamente, é óbvio que alterar a estrutura de armazenamento e processamento de dados não traz o conhecimento mais recente. Obviamente, é perfeitamente aceitável chamar um repositório semântico contendo a descrição mais completa de uma determinada área de assunto como um gráfico de conhecimento. Mas, ao mesmo tempo, devemos entender que não estamos lidando com o conhecimento em um sentido significativo, mas com uma grande variedade de fatos relacionados que o tornam conveniente para realizar uma pesquisa. E aqui deve-se notar que, em comparação com as tabelas relacionais no gráfico, não há conexão de dados adicional especial - a transferência de dados de um esquema para outro não aumenta o número de links. O formato semântico simplifica apenas a criação de novos relacionamentos,isto é, permite adicionar novos tipos de dados ao gráfico sem nenhuma alteração na estrutura de armazenamento. Mas isso é novamente uma conveniência tecnológica, e não uma razão para falar sobre “dados relacionados” especiais (dados vinculados).

E, é claro, a afirmação de que as ontologias de computadores são capazes de gerar novos conhecimentos não causa nada além de um sorriso: sim, com a ajuda da inferência lógica produzida por programas especiais de risoner, novas declarações podem ser obtidas na ontologia. Mas a lógica dessa conclusão é comparável com a conclusão de uma criança de três anos de idade "o avô é o pai do meu pai". Obviamente, uma conclusão lógica é necessária para uma pesquisa avançada, mas você deve admitir que ele não pode gerar nenhum conhecimento novo em princípio; ele só pode salvar dados desnecessários (por exemplo, ele não precisa atribuir a cada pai que ele também se tornou avô no momento do nascimento de seu filho). criança). E aqui novamente, você deve prestar atenção ao fato de que ninguém se preocupa da mesma maneira em derivar "novos conhecimentos" em aplicativos com bancos de dados relacionais:adicione uma coluna para o atributo "avô" e controle programaticamente a adição do fato do nascimento de um filho. O uso da abordagem ontológica apenas unifica operações de inferência lógica, simplifica a adição de novos axiomas, torna possível armazená-los no mesmo formato que os dados, mas não adiciona nenhuma "inteligência" a ele.

Portanto, a tecnologia semântica não é sobre semântica. Eles são sobre unificação, padronização, identificação, modificação de uma grande variedade de dados heterogêneos, sobre a troca de dados entre aplicativos independentes, sobre uma pesquisa complexa ... Mas não sobre o significado e não sobre novos conhecimentos. Em vez disso, eles não são mais sobre significado e novos conhecimentos do que outras tecnologias para armazenar e processar dados. No entanto, você não deve tomar essas conclusões como um pedido para abandonar a terminologia estabelecida - deixe a tecnologia permanecer semântica, o gráfico um gráfico de conhecimento e os dados conectados (Dados Vinculados). Você só precisa entender o que você pode ensinar a um computador e o que não.

(Continua)

All Articles