Rencontrez la langue tchouvache dans Yandex.Translate: comment nous résolvons le principal problème de la traduction automatique

Les régions de la Russie ne sont pas seulement des frontières sur la carte. Chaque région a ses propres traditions culturelles et beaucoup ont leur propre langue. La traduction automatique pourrait aider à préserver et à appliquer ces langues - en particulier, publier des articles sur Wikipedia. Mais que se passe-t-il si les données d'apprentissage de l'intelligence artificielle ne suffisent pas?


Aujourd'hui, nous allons parler de notre approche en utilisant l'exemple du langage tchouvache que nous avons enseigné à Yandex.Translator. Selon le dernier recensement, plus d'un million de personnes considèrent cette langue comme native.




Mais pour commencer, un peu de fond.


. , : — , . . . , . , . . .


, . . , — , . .


, . . , , . , , . .


, , , ( ). ( , ), . , , , . , ?



, . . , . , , 250 . . , , .


. (, ), . - , : - . , — .



— —


: , - (!) . .

?



. , , , . , .


. : , , , , , , — . . , . , «»: gümüş — өө — ө — үі — үү — gümüş — kumush — ӗӗ. , , , «» . SMT, / — .



, . . . , back-translation. ?


, , . , . : ( ). , - , . , . , , , . , .


, , , «» . tagged back-translation: «» — (pun intended) - .


!


, , . - ., : [ -].


, -, . , . .

Source: https://habr.com/ru/post/undefined/


All Articles