语义数字系统

在先前的文章(语义技术的神话)中,有人指出,IT语义中没有语义。虽然,当然,您需要分别回答两个问题:(1)数据是否包含含义? (2)计算机是否理解此含义?我们将把第二个问题留给哲学家,尽管答案已经很明显了。第一个答案也很明显:需要信息系统来处理信息,即有意义的,语义定义的数据。当然,在这种情况下,必须理解,这些数据仅对最初生成这些数据,编写程序进行处理并最终理解其含义的人有意义。

不同的IT系统对数据内容的关系不同。有些应用程序对含义无动于衷,也就是说,它们在处理数据时完全忽略了它们的内容。这些包括处理文本,声音,图像的最简单的程序。他们的算法不关注已处理文件的内容。文本编辑器不在乎是否将学生的商业合同,科学文章或家庭作业载入其中。

其余的IT系统对语义敏感,也就是说,它们以某种方式对数据内容做出反应。与第一类系统不同,此类系统不是将数据存储在“平滑”文件中,而是以结构化数组的形式存储,并细分为类型和值。这种数据结构应该与语义相关联。此外,应注意,有两种方法可以指定数据的语义:(1)通过系统的体系结构,例如,使用数据库表的结构,以及(2)通过配置数据本身。也就是说,数据的语义要么严格取决于应用程序的结构,要么可以独立于缝合到数据本身的应用程序。当数据模型由数据本身确定时,结构化数据的第二种方法就是所谓的语义。

因此,应该强调使用特殊语义数据格式运行的特殊类型的IT系统。语义系统的主要区别在于,数据处理算法不是由应用程序体系结构(数据库结构或程序代码)指定的,而是由数据本身指定的:数据值,其类型和逻辑关系以统一格式的语句数组的形式编写。就是说,一方面,我们拥有一种格式,数据可以用来描述自己,它们的语义,另一方面,可以处理任意语义的数据的通用应用程序,只要它们与该格式相对应即可。在这里,确实有一种诱人的说法,即语义系统理解数据的含义,尽管我们当然应该只谈论一种含义与另一种含义的形式上的区别,没有计算机的任何理解。

当然,这里应该注意的是,目前,语义系统尚未完全达到其非语义竞争对手的水平。到目前为止,语义标记仅允许您修复静态数据结构:描述实体,属性,个体,个体的属性值,建立实体之间的从属关系以及设置派生新语句的规则。也就是说,现代语义系统本质上是一个通用的数据仓库,能够根据数据本身所包含的公理和规则来执行复杂的搜索并生成新数据。此外,存储可以是分布式的(网络)或本地的。为了使技术完全满意,没有足够的行为描述说明,即在语义数据中嵌入业务流程模型的方法。

让我们尝试着重强调语义系统相对于标准系统的优势,以及实现这些优势所必需的条件(说明书中未提及任何标准)。

首先,语义系统是通用应用程序,并不严格地与主题领域联系在一起。要使用各种数据模型,应用程序无需进行任何更改;仅需要使用特殊语言描述主题区域的结构,即创建其本体并将本体与实际数据一起加载到应用程序中。而且,可以随时修改数据结构,并以新的概念,关系,规则进行补充。

显然,语义应用程序通常比其数据结构和算法在代码中硬编码的应用程序要慢。但是,在许多业务流程中,其建模速度和自由修改模型的能力比应用程序的速度更为重要。

语义技术的最重要优点包括数据交换的自动化。由于通用的数据描述格式,独立的应用程序可以自由交互。要完全实现此功能,必须满足两个条件:(1)应用程序使用包含实体定义的单个字典,(2)应用程序支持唯一的实体标识,从而防止冲突。字典必须采用语义数据格式,并且其元素还必须具有唯一的标识符。结果,我们获得了集体使用本体和免费(没有任何API)数据交换的机会。

数据的语义表示(即,将一组事实数据及其概念方案组合在一起)使您可以考虑各种条件和依赖性来实现复杂的搜索选项。此外,搜索不仅可以通过本地本体存储库进行,还可以通过网络上的各种应用程序进行。

因此,语义技术的主要任务是统一处理数据,以便优化主题区域的符号模型的构造,自动执行独立应用程序之间的数据交换并优化数据搜索。问题得以解决:(1)在数据本身中包含元数据;(2)数据格式的统一;(3)引入数据的唯一标识;(4)词典和输出规则的标准化。

持续的语义和活动

All Articles