Lernen Sie die Tschuwaschische Sprache in Yandex kennen. Übersetzen: Wie wir das Hauptproblem der maschinellen Übersetzung lösen

Regionen Russlands sind nicht nur Grenzen auf der Karte. Jede Region hat ihre eigenen kulturellen Traditionen und viele haben ihre eigenen Sprachen. Die maschinelle Übersetzung könnte dazu beitragen, diese Sprachen zu erhalten und anzuwenden - insbesondere Artikel auf Wikipedia zu veröffentlichen. Was aber, wenn die Daten zum Erlernen der maschinellen Intelligenz nicht ausreichen?


Heute werden wir am Beispiel der Tschuwaschischen Sprache, die wir Yandex.Translator beigebracht haben, über unseren Ansatz sprechen. Laut der letzten Volkszählung betrachten mehr als eine Million Menschen diese Sprache als Muttersprache.




Aber für den Anfang ein wenig Hintergrund.


. , : — , . . . , . , . . .


, . . , — , . .


, . . , , . , , . .


, , , ( ). ( , ), . , , , . , ?



, . . , . , , 250 . . , , .


. (, ), . - , : - . , — .



— —


: , - (!) . .

?



. , , , . , .


. : , , , , , , — . . , . , «»: gümüş — өө — ө — үі — үү — gümüş — kumush — ӗӗ. , , , «» . SMT, / — .



, . . . , back-translation. ?


, , . , . : ( ). , - , . , . , , , . , .


, , , «» . tagged back-translation: «» — (pun intended) - .


!


, , . - ., : [ -].


, -, . , . .

Source: https://habr.com/ru/post/undefined/


All Articles