Conozca el idioma Chuvash en Yandex.Translate: cómo resolvemos el problema principal de la traducción automática

Las regiones de Rusia no son solo fronteras en el mapa. Cada región tiene sus propias tradiciones culturales, y muchas tienen sus propios idiomas. La traducción automática podría ayudar a preservar y aplicar estos idiomas, en particular, publicar artículos en Wikipedia. ¿Pero qué pasa si los datos para aprender inteligencia de máquina no son suficientes?


Hoy hablaremos sobre nuestro enfoque utilizando el ejemplo del lenguaje Chuvash que enseñamos Yandex.Translator. Según el último censo, más de un millón de personas consideran este idioma nativo.




Pero para empezar, un poco de historia.


. , : — , . . . , . , . . .


, . . , — , . .


, . . , , . , , . .


, , , ( ). ( , ), . , , , . , ?



, . . , . , , 250 . . , , .


. (, ), . - , : - . , — .



— —


: , - (!) . .

?



. , , , . , .


. : , , , , , , — . . , . , «»: gümüş — өө — ө — үі — үү — gümüş — kumush — ӗӗ. , , , «» . SMT, / — .



, . . . , back-translation. ?


, , . , . : ( ). , - , . , . , , , . , .


, , , «» . tagged back-translation: «» — (pun intended) - .


!


, , . - ., : [ -].


, -, . , . .

Source: https://habr.com/ru/post/undefined/


All Articles