人工智能将首先创造出古代斯拉夫手稿的语料库

图片

“在怀疑的日子里,在对祖国命运的痛苦思考的日子里”,这在最近几周特别困难,对我们有什么支持和支持? :)是的,伟大而强大。尽管汇率和大流行势不可挡地保持着大众意识,但科学家们并没有停止工作。在我们的新闻中,关于谁以及为什么将创建主体-古代斯拉夫手稿的独特“ DBMS”。

NUST“ MISiS,俄罗斯语言学院的科学家合作V.V.在莫斯科教区理事会辖下的大学和科学共同体工作委员会的支持下,HSE的Vinogradova RAN启动了一个大型项目,该项目利用人工智能和机器学习技术创建了古代斯拉夫手稿的独特基础-语料库。创建旧斯拉夫语言的语料库将为语言研究人员和历史学家提供研究所有现代斯拉夫民族语言和文化的有力工具,并将成为理解其遗产的独特钥匙。

语料库是一种结构化的语言数据库,是一种基于特定语言的电子形式的文本集合的信息和参考系统。它是手工挑选并经过特殊处理的(标记为)的文本集,这些语言被用作研究语言的词汇和语法的基础。

图片

古代斯拉夫文字是十一至十七世纪的各种手稿纪念碑,是所有现代民族斯拉夫语言和文化的基础。语言的系统语料库的创建与艰苦,微妙和艰苦的工作相关,需要来自各个领域的专业人员的共同努力,而且据科学家们说,这是一项全国性的任务。

莫斯科教区理事会大学和科学共同体工作委员会副主席Hieromonk Rodion(Larionov):
« , . – , , XI – XVII , – . . , -, , , , -, . , – , , , , , , . , ».
人工智能将覆盖整个庞大的数据阵列,系统化并创建用于安排语言标记(语料库的主要特征)的算法。是她将案件与简单的图书馆区分开来。
在欧洲国家,有关使用数字方法分析文化遗产的项目正在积极开展,并且是跨学科互动的一个很好的例子。

关于语言古迹,可以注意到两个主要的工作领域-将扫描的图像转换为“机器可读”形式以及简化语言分析和理解的语言模型。对于斯拉夫语的文本,其字母(字素)的拼写具有浮夸性和变音符号的广泛使用的特点,尚未进行系统的发展。

图片

, MegaScience «», - :
« . , . , . , – ».

图片

该项目的第一阶段将是对旧俄文,保加利亚文和塞尔维亚文中的十一至十七世纪的旧斯拉夫米纳综合建筑群进行数字化和标记-官方教堂书籍包含该教堂年度所有日子的服务时间表,其手稿存储在国家历史博物馆,俄罗斯国家和州立图书馆,俄罗斯文库中国家古档案馆,圣三位一体圣·谢尔盖·拉夫拉。

有人会说,嗯,那里还有其他古代斯拉夫手稿,世界已经完全关闭。但是,值得记住的是,毕竟“一开始就是道”。

All Articles