满足Yandex中的Chuvash语言。翻译:我们如何解决机器翻译的主要问题

俄罗斯地区不仅是地图上的边界。每个地区都有自己的文化传统,许多地区都有自己的语言。机器翻译可以帮助保留和应用这些语言-特别是在Wikipedia上发布文章。但是,如果用于学习机器智能的数据还不够怎么办?


今天,我们将使用我们教给Yandex.Translator的Chuvash语言示例来讨论我们的方法。根据最新的人口普查,超过一百万的人认为这种语言是母语。




但是对于初学者来说,有一点背景。


. , : — , . . . , . , . . .


, . . , — , . .


, . . , , . , , . .


, , , ( ). ( , ), . , , , . , ?



, . . , . , , 250 . . , , .


. (, ), . - , : - . , — .



— —


: , - (!) . .

?



. , , , . , .


. : , , , , , , — . . , . , «»: gümüş — өө — ө — үі — үү — gümüş — kumush — ӗӗ. , , , «» . SMT, / — .



, . . . , back-translation. ?


, , . , . : ( ). , - , . , . , , , . , .


, , , «» . tagged back-translation: «» — (pun intended) - .


!


, , . - ., : [ -].


, -, . , . .

Source: https://habr.com/ru/post/undefined/


All Articles