Les régions de la Russie ne sont pas seulement des frontières sur la carte. Chaque région a ses propres traditions culturelles et beaucoup ont leur propre langue. La traduction automatique pourrait aider à préserver et à appliquer ces langues - en particulier, publier des articles sur Wikipedia. Mais que se passe-t-il si les données d'apprentissage de l'intelligence artificielle ne suffisent pas?
Aujourd'hui, nous allons parler de notre approche en utilisant l'exemple du langage tchouvache que nous avons enseigné à Yandex.Translator. Selon le dernier recensement, plus d'un million de personnes considèrent cette langue comme native.

Mais pour commencer, un peu de fond.
. , : — , . . . , . , . . .
, . . , — , . .
, . . , , . , , . .
, , , ( ). ( , ), . , , , . , ?
, . . , . , , 250 . . , , .
. (, ), . - , : - . , — .

— —
: , - (!) . .
?
. , , , . , .
. : , , , , , , — . . , . , «»: gümüş — өө — ө — үі — үү — gümüş — kumush — ӗӗ. , , , «» . SMT, / — .
, . . . , back-translation. ?
, , . , . : ( ). , - , . , . , , , . , .
, , , «» . tagged back-translation: «» — (pun intended) - .
!
, , . - ., : [ -].
, -, . , . .