语义技术的神话

在先前的文本“语义网的神话”中,试图证实这种思想,即在其创始人最初提出的技术解决方案框架内,语义网仍将是一个梦想。尽管W3C语义工具本身并非没有尖叫声,但带有微调文件,但它们已非常成功地用于企业项目中的本体建模。

现在,让我们尝试讨论甚至在专业人士中讨论语义方法时都能听到的神话。

因此,所谓的语义技术是技术的主要神话,根据其创始人的说法,该技术旨在使计算机理解文本或单个字符的内容(含义),这恰恰说明了IT语义与含义有关。并且为了识别此事件,足以认识到切换为记录事实的不同格式,不同的数据组织方案,不同的生成事实的方法并不能从根本上改变信息技术的本质-我从未理解过,计算机仍然不理解含义以编程方式处理的字符。从关系数据库中将数据作为一组三元组写入不会增加任何意义。用图形替换表格对于统一数据模型,实现复杂的搜索,安全地修改业务模型等非常有用,但这不会使计算机理解数据的含义。

允许使用“理解含义”这一短语(尽管用引号引起)的唯一情况是在讨论独立应用程序之间的数据交换时。可以说,使用单一记录格式(RDF)和统一词典使计算机能够“理解”来自未知提供者的数据的含义。尽管很明显也没有必要进行任何理解:解决名称空间的无条件重要但本质上是平庸的问题,解决了对相同类型的数据使用相同标识符的问题(我们只同意列名)。

使用所谓的URI作为实体或其类型的标识符不会增加含义。除此以外,指向实体说明的“添加感官”链接。尽管这又与语义无关,语义被解释为“计算机对意义的理解”;在这里,我们只是在谈论为人类可视化数据的便利性。另外,在任何IT系统的电子文档中,实体的描述都必须与存储库中的标识符关联。

神话还表明,语义技术与传统技术不同,它与知识一起工作。毕竟,很显然,改变数据存储和处理的结构并不能充分利用最新知识。当然,将包含某个主题领域的最完整描述的语义库称为知识图是完全可以接受的。但是同时,我们必须理解,我们不是在有意义的意义上处理知识,而是处理大量相关事实,这使得进行搜索变得很方便。在此应该注意的是,与图中的关系表相比,没有特殊的附加数据连接-从一种方案到另一种方案的数据传输不会增加链接数。语义格式仅简化了新关系的创建,也就是说,它允许您在不更改存储结构的情况下向图添加新的数据类型。但这又是技术上的便利,而不是讨论特殊“相关数据”(链接数据)的理由。

当然,关于计算机本体能够产生新知识的陈述只会引起微笑,是的,是的,借助于特殊的risoner程序产生的逻辑推理,可以在本体中获得新的陈述。但是,这一结论的逻辑在水平上与一个三岁孩子“祖父是我父亲的父亲”的结论相当。当然,这样的逻辑结论对于进行高级搜索是必要的,但是您必须承认他不能产生任何新知识,他只能保存不必要的数据(例如,他不需要将每个父亲都归因于他在出生时也成为祖父)儿童)。同样,在这里,您应该注意以下事实:没有人会以相同的方式来烦恼关系数据库应用程序中的“新知识”:为属性“祖父”添加一列,并以编程方式控制孩子出生事实的添加。使用本体论方法只能统一逻辑推理操作,简化新公理的添加,使其可以与数据相同的格式存储,而不会对其添加任何“智能”。

因此,语义技术根本与语义无关。它们是关于大量异构数据的统一,标准化,标识,修改,关于独立应用程序之间的数据交换,关于复杂的搜索……但与含义无关,与新知识无关。相反,与其他用于存储和处理数据的技术相比,它们与意义和新知识无关。但是,您不应将这些发现视为放弃已建立的术语的要求-让技术保持语义,将图保留为知识图,并保留相关数据(链接数据)。您只需要了解您可以教一台计算机的内容,而不能教什么。

(未完待续)

All Articles