Comment j'ai gagné 1 000 000 $ sans expérience ni relations, puis les ai dépensés pour faire mon traducteur

Comment tout a commencé


Cette histoire a commencé il y a 15 ans. Tout en travaillant en tant que programmeur dans la capitale, j'ai accumulé de l'argent et quitté mon emploi afin de créer mes propres projets plus tard. Pour économiser de l'argent, il est rentré chez lui, dans une petite ville natale, où il a travaillé sur un site Web pour les étudiants, un programme d'échange, des jeux pour téléphones portables. Mais en raison du manque d'expérience en affaires, cela n'a pas généré de revenus, et bientôt les projets ont été fermés. J'ai dû retourner dans la capitale et trouver un emploi. Cette histoire s'est répétée plusieurs fois.

Lorsque mon argent a épuisé à nouveau, la crise est venue. Je n'ai pas pu trouver d'emploi, la situation est devenue critique. Le moment est venu de regarder toutes choses avec un regard sobre. Je devais honnêtement m'avouer que je ne savais pas quelles niches choisir pour les affaires. Créer des projets que vous aimez est le chemin qui mène à nulle part.

La seule chose que je pouvais faire était des applications iOS. Plusieurs années de travail dans des entreprises informatiques m'ont permis d'acquérir une certaine expérience, et il a été décidé de faire de nombreuses applications simples fondamentalement différentes (jeux, musique, dessin, mode de vie sain, apprentissage des langues) et de tester dans quelles niches il y aura peu de concurrence. Un ensemble de classes et de bibliothèques a été préparé qui a permis de créer rapidement des applications simples sur divers sujets (jeux 2D, trackers GPS, utilitaires simples, etc.). La plupart d'entre eux avaient plusieurs photos, 2 boutons et une seule fonction. Mais c'était suffisant pour tester l'idée et à quel point il serait facile de gagner de l'argent avec. Par exemple, une application en cours d'exécution suit la vitesse, la distance parcourue et le nombre de calories d'une personne. J'ai passé un an et demi à créer des centaines d'applications simples.Cette vitesse a été rendue possible grâce à l'achat de graphiques sur les stocks, ainsi qu'à la réutilisation des codes sources.



Au début, les applications étaient gratuites. Ensuite, j'ai ajouté des annonces et des achats intégrés, ramassé des mots clés et des icônes lumineuses. Le téléchargement des applications a commencé.

Lorsque les revenus ont atteint 30 000 $ / mois, j'ai décidé de dire à un ami qui travaillait dans une grande entreprise alimentaire que j'étais en mesure d'atteindre un tel chiffre sur les applications de test, et j'ai suggéré de les créer ensemble. Il a répondu qu'ils n'avaient qu'une seule application - un jeu avec un revenu de 60 000 $ et 25 000 utilisateurs par mois, contre 30 000 $ de revenus et 200 000 utilisateurs de moi. Cela a complètement changé mon point de vue. Il s'est avéré qu'il valait mieux créer une application de haute qualité que cent applications de faible qualité

J'ai compris que vous pouvez gagner des dizaines de fois plus avec des produits de haute qualité, mais j'étais seul dans une petite ville sans l'expérience et l'équipe de designers et de spécialistes du marketing. Je devais payer pour louer un appartement et gagner ma vie. Les applications de test étaient nécessaires simplement pour tester des niches de marché et des stratégies publicitaires afin d'apprendre quelles applications et comment les créer. Il se trouve que certains d'entre eux ont commencé à générer de bons revenus. Maintenant, le sujet des applications simples est mort depuis longtemps, et il n'y a plus beaucoup d'argent à gagner.

Certaines applications différaient considérablement en termes de profit - il s'agissait de traducteurs, d'applications pour le transport de marchandises, de programmes musicaux (qui simulent jouer du piano, de la batterie ou, par exemple, des accords de guitare, des joueurs), ainsi que de simples jeux de logique.

Lors du test de différents types de jeux, j'ai réalisé que les jeux avec une longue durée de session et l'implication des utilisateurs (comme «2048») peuvent rapporter beaucoup d'argent sur un long intervalle de temps. Mais au début, ce n'était pas évident. Par conséquent, j'ai créé des tests tels que des trackers GPS pour les skieurs et dans les mots clés j'ai mis le nom de stations de ski populaires comme Courchevel. Et puis il était content qu'un clic sur la publicité rapporte 2 $. Mais c'était une stratégie à court terme, non évolutive.

Puis j'ai remarqué qu'en seulement un mois, les traducteurs ont téléchargé plus d'un million de fois. Et cela malgré le fait qu'ils se trouvaient approximativement à la 100e position dans le classement de la catégorie.

Les applications musicales ont fait autant de sauts, mais étant donné l'implication des utilisateurs, elles étaient moins prometteuses. Les utilisateurs pour eux doivent être attirés par des mots-clés à haute fréquence, et il n'y en a pas beaucoup dans ce créneau: ceux qui recherchent des applications pour la guitare entrent "guitare", "guitare basse", "accords", etc. dans la recherche. Il est difficile de trouver de nombreux synonymes pour ces sujets. Ainsi, les utilisateurs se concentrent sur les demandes à haute fréquence, et tôt ou tard leur implication sera coûteuse. Les traducteurs sont différents.

Il existe des centaines de langues dans le monde, et les gens saisissent non seulement le mot général «traducteur», mais quelques mots comme solution à leur problème: «traduire en français», «traducteur du chinois». S'il y a beaucoup de demandes, vous pouvez attirer les utilisateurs simplement par des mots-clés de moyenne fréquence (ASO). La niche s'est avérée prometteuse, d'autant plus que j'aimais le sujet des traductions.

Plus tard, environ 40 traducteurs simples ont été créés à l'aide de la traduction fournie par l'API Google. Son coût était de 20 $ pour 1 million de caractères traduits. Progressivement, des versions améliorées des applications sont apparues, où j'ai ajouté des publicités, des achats intégrés et la traduction vocale.

Ayant gagné de l'argent, j'ai déménagé à Minsk et acheté une maison. À cette époque, j'avais 50 à 70 applications de traduction et 5 millions de téléchargements. Mais avec la croissance des utilisateurs, le coût de l'API Google Translate payée a augmenté. La rentabilité de l'entreprise a fortement diminué. Les utilisateurs payants ont traduit des blocs de 1 000 caractères à la fois, ce qui a forcé l'introduction de limites sur la demande. Quand ils se sont reposés sur la limite de la traduction, ils ont écrit de mauvaises critiques et rendu l'argent. Le moment est venu où 70% des recettes sont allées aux dépenses. Avec de gros volumes de traduction, cette activité n'était pas si prometteuse. Afin de récupérer les coûts, il était nécessaire d'ajouter beaucoup de publicité aux applications, ce qui effraie toujours les utilisateurs. Il était nécessaire de créer sa propre API de traduction, ce qui ne serait probablement pas bon marché.

J'ai essayé de demander des conseils et des investissements aux startups et à la communauté informatique, mais je n'ai pas trouvé de support. La plupart des gens ne comprenaient pas pourquoi travailler dans un marché où il y avait déjà un leader - un traducteur Google.

En plus de Google, plusieurs sociétés ont fourni une API pour la traduction. J'étais prêt à payer 30 000 $ pour leurs licences de technologie de traduction dans 40 langues. Cela me permettrait de traduire un nombre illimité de fois pour un prix fixe et de servir n'importe quel nombre d'utilisateurs sur mes serveurs. Mais en réponse, ils m'ont appelé le montant plusieurs fois plus élevé. C'était trop cher. Il a été décidé d'essayer de créer leur propre technologie de traduction. J'ai essayé d'attirer des amis pour le développement, mais la plupart d'entre eux avaient déjà des familles, des enfants en bas âge et des prêts. Tout le monde voulait de la stabilité et de la vie à son gré pour un bon salaire, et non pas aller dans une startup. Ils ne comprenaient pas non plus pourquoi créer un traducteur s'il existe Google avec une application de traduction et une API sympas et sophistiquées. Je n'avais aucune expérience de prise de parole en public,charisme et applications cool de prototype pour intéresser les gens. L'analyse des gains de 300 000 $ sur les applications de traduction test n'a surpris personne.

Je me suis tourné vers un ami qui possède une entreprise d'impartition à Minsk. Fin 2016, il m'a affecté une équipe. Je m'attendais à pouvoir résoudre le problème en six mois sur la base de projets open source, afin de ne pas dépendre de l'API sur Google.

En route vers mon traducteur


Le travail a commencé. En 2016, nous avons trouvé plusieurs projets open source - Apertium, Joshua et Moses. Il s'agissait d'une traduction automatique statistique, adaptée aux textes simples. Ces projets ont été soutenus par 3 à 40 personnes et il a fallu beaucoup de temps pour obtenir une réponse à une question les concernant. Après l'avoir compris et les avoir exécutés pour les tests, il est devenu clair que nous avions besoin de serveurs puissants et d'ensembles de données de haute qualité, qui sont chers. Même après avoir dépensé de l'argent pour du matériel et un ensemble de données de qualité pour l'une des paires de traduction, la qualité laissait beaucoup à désirer.

Techniquement, cela ne se résumait pas au schéma «télécharger l'ensemble de données et former». Il s'est avéré qu'il y avait un million de nuances dont nous n'étions même pas conscients. Nous avons essayé quelques ressources supplémentaires, mais nous n'avons pas obtenu de bons résultats. Mais Google et Microsoft ne dévoilent pas leurs réalisations. Néanmoins, le travail a continué, les pigistes se sont connectés périodiquement.

En mars 2017, nous sommes tombés sur un projet appelé Open NMT. Il s'agit d'un développement conjoint de Systran, l'un des leaders du marché de la traduction automatique, et de l'Université Harvard. Le projet venait juste d'être lancé et offrait déjà une traduction sur la base d'une nouvelle technologie - les réseaux de neurones.

Les technologies modernes de traduction automatique appartiennent à de grandes entreprises, elles sont fermées. Les petits joueurs, réalisant combien il est difficile d'infiltrer ce monde, ne font pas de telles tentatives. Cela entrave le développement du marché. La qualité de la traduction entre les dirigeants n'a pas beaucoup différé les uns des autres pendant longtemps. De toute évidence, les grandes entreprises ont également été confrontées à une pénurie de passionnés, d'articles scientifiques, de startups et de projets open source afin de prendre de nouvelles idées et d'embaucher des personnes.

Systran a donc fait une manœuvre fondamentalement nouvelle: disposer ses bases en open source, pour que des passionnés comme moi puissent s'impliquer dans ce travail. Ils ont créé un forum où leurs experts ont commencé à aider les nouveaux arrivants gratuitement. Et cela a apporté un bon retour: des start-ups, des travaux scientifiques sur la traduction ont commencé à apparaître, puisque tout le monde pouvait en prendre la base et mener ses expériences sur cette base. Systran a dirigé cette communauté. Puis d'autres sociétés se sont jointes.

À cette époque, il n'y avait toujours pas de traduction neuronale omniprésente, et l'Open NMT offrait des bases dans ce domaine, surpassant la traduction automatique statistique en qualité. Moi et d'autres gars du monde entier pourrions utiliser ces technologies et demander conseil à des experts. Ils ont volontiers partagé leurs expériences, ce qui m'a permis de comprendre dans quelle direction aller.

Nous avons pris OpenNMT comme base. Cela s'est produit au début de 2017, alors qu'il était encore «brut» et ne contenait rien d'autre que des fonctions de base. Tout cela était sur Lua (Torch), uniquement pour la recherche académique. De nombreux bugs ont été trouvés, tout fonctionnait lentement, instable et s'est écrasé sous une charge légère. Il n'était pas du tout adapté à la production. Ensuite, dans une conversation générale, nous avons tous testé ensemble, détecté des erreurs, partagé des idées, augmentant progressivement la stabilité (nous étions alors une centaine de personnes). Au début, je me demandais: comment, pourquoi Systran fait-il croître ses concurrents? Mais au fil du temps, j'ai compris les règles du jeu, lorsque de plus en plus d'entreprises ont commencé à établir leurs bases pour le traitement du langage naturel en open source.

Même si tout le monde a la puissance de calcul pour gérer de grands ensembles de données, la question de trouver des spécialistes en PNL (traitement du langage naturel) est aiguë sur le marché. En 2017, ce sujet était beaucoup moins développé que le traitement d'images et de vidéos. Moins d'ensembles de données, d'articles scientifiques, de spécialistes, de cadres et plus encore. Il y a encore moins de personnes capables de créer une entreprise et de fermer l'une des niches locales des documents de recherche en PNL. Les deux sociétés de premier plan comme Google et les petits joueurs de Systran doivent obtenir un avantage concurrentiel sur les joueurs de leur catégorie.

Comment résolvent-ils ce problème?

À première vue, cela semble étrange, mais pour se faire concurrence, ils décident d'introduire de nouveaux acteurs (concurrents) sur le marché, et pour qu'ils y apparaissent, vous devez le faire basculer. Le seuil d'entrée est toujours élevé, et la demande de technologies de traitement de la parole augmente fortement (assistants vocaux, robots de chat, traductions, reconnaissance et analyse de la parole, etc.). Le nombre requis de startups que vous pouvez acheter pour renforcer votre position est toujours pas encore.

Dans le domaine public publié des travaux scientifiques des équipes de Google, Facebook, Alibaba. À partir d'eux, leurs cadres et ensembles de données sont présentés en open source. Les forums sont créés avec des réponses aux questions.

Les grandes entreprises sont intéressées par le développement de startups comme la nôtre, capturant de nouvelles niches et affichant une croissance maximale. Ils sont heureux d'acheter des startups PNL pour renforcer leurs grandes entreprises.

En effet, même si vous avez tous les jeux de données et algorithmes entre vos mains et qu'ils vous le disent, cela ne signifie pas que vous ferez un traducteur de haute qualité ou une autre startup dans le domaine de la PNL. Et même si vous le faites, alors c'est loin du fait que vous mordiez une grande partie du marché. Par conséquent, vous avez besoin d'aide et si quelqu'un réussit, achetez ou fusionnez.

En mars 2018, Systran a invité toute la communauté à Paris pour échanger des expériences et a également organisé une master class gratuite sur les principaux problèmes rencontrés par les startups en traduction. Tout le monde était intéressé à se voir en direct.

Tout le monde avait différents projets. Quelqu'un a créé un bot pour apprendre l'anglais, avec lequel vous pouvez parler comme une personne. D'autres ont utilisé openNMT pour résumer le texte. Une partie importante des startups représentait des plug-ins pour SDL Trados Studio, adaptés à un sujet spécifique (médecine, construction, métallurgie, etc.) ou à une langue pour aider les traducteurs à gagner du temps lors de la modification du texte traduit.

En plus des passionnés, les gars d'Ebay et de Booking sont arrivés à Paris, qui créent un interprète sur la même plateforme que nous, mais optimisé pour la traduction des descriptions d'enchères et d'hôtels.

Toujours en mai 2017, Facebook a publié ses bases pour la traduction automatique de Fairseq en open-source ainsi que des modèles de tests formés. Mais nous avons décidé de rester sur OpenNMT, en regardant comment la communauté se développe.

Histoire de DeepL


En septembre 2017, en analysant les concurrents, j'ai découvert DeepL. Ils ont juste commencé à ce moment-là et ont fourni la traduction en seulement 7 langues. DeepL a été positionné comme un outil pour les traducteurs professionnels, aidant à passer moins de temps sur la relecture après la traduction automatique. Même un petit changement dans la qualité de la traduction permet d'économiser beaucoup d'argent pour les entreprises de traduction. Ils surveillent constamment l'API pour la traduction automatique de différents fournisseurs, car la qualité dans de nombreuses paires de langues est différente pour tout le monde et il n'y a pas de leader unique. Bien que le nombre de langues - surtout chez Google.

Pour démontrer la qualité de la traduction, DeepL a décidé d'exécuter des tests dans certaines langues.

techcrunch.com/2017/08/29/deepl-schools-other-online-translators-with-clever-machine-learning

L'évaluation de la qualité a été réalisée par des tests à l'aveugle, lorsque des traducteurs professionnels choisissent la meilleure traduction de Google, Microsoft, DeepL, Facebook. Selon les résultats, DeepL a gagné, le jury a classé sa traduction comme la plus «littéraire».

Comment est-ce arrivé?

Fondateurs de la start-up DeepL Linguee - la plus grande base de données de liens vers des textes traduits. Très probablement, ils ont un grand nombre d'ensembles de données assemblés par des analyseurs, et pour les former, vous avez besoin de plus de puissance de calcul.

En 2017, ils ont publié un article déclarant qu'ils avaient assemblé un supercalculateur 5 petFlops en Islande (à l'époque, c'était le 23e en termes de performances dans le monde). Former un modèle de grande qualité n'était qu'une question de temps. À ce moment, il semblait que même si nous achetons des ensembles de données de haute qualité, nous ne pourrons toujours pas rivaliser avec eux sans un tel super-ordinateur.

www

. Nvidia lance un ordinateur DGX-2 de la taille d'une table de chevet et une performance de 2 petFlops (FP16), qui peuvent désormais être loués à partir de 5000 $ / mois.

www.nvidia.com/en-us/data-center/dgx-2

Avec un tel ordinateur, vous pouvez rapidement former vos modèles avec des jeux de données géants et garder une grande charge sur l'API. Cela modifie considérablement l'équilibre des pouvoirs de l'ensemble du marché des startups d'apprentissage automatique et permet aux petites entreprises de concurrencer les géants dans le domaine du travail avec les mégadonnées. C'était la meilleure offre du marché dans un rapport qualité-prix.

J'ai commencé à chercher des informations sur les statistiques DeepL. Pour 2018, Google comptait 500 millions d'utilisateurs par mois. DeepL en a 50 millions (article du 12 décembre 2018).

slator.com/ma-and-funding/benchmark-capital-takes-13-6-stake-in-deepl-as-usage-explodes

Il s'avère qu'à la fin de 2018, 10% de l'audience mensuelle de Google utilisait DeepL, et ils n'étaient pas particulièrement annoncés nulle part. En un peu plus d'un an, ils ont conquis 10% du marché grâce au bouche à oreille.

J'y ai pensé. Si DeepL a vaincu Google avec une équipe de 20 personnes, ayant une voiture dans 5 petaFlops en 2017, et maintenant vous pouvez louer à moindre coût une voiture dans 2 petaFlops et acheter des ensembles de données de haute qualité, à quel point sera-t-il difficile d'atteindre la qualité Google?

Panneau de contrĂ´le Lingvanex


Afin de traiter rapidement les tâches de traduction et de ne pas exécuter de tests à partir de la console, un tableau de bord a été créé qui vous permet d'effectuer toutes les tâches, de la préparation et du filtrage des données au déploiement des tests de traduction jusqu'à la production. Dans l'image ci-dessous: à droite se trouve une liste des tâches et des serveurs GPU sur lesquels les modèles sont formés. Au centre se trouvent les paramètres du réseau neuronal, et ci-dessous les ensembles de données qui seront utilisés pour la formation.



Les travaux sur une nouvelle langue ont commencé par la préparation d'un ensemble de données. Nous les avons empruntés à des sources ouvertes telles que Wikipédia, des réunions du Parlement européen, Paracrawl, Tatoeba et bien d'autres. Pour obtenir une qualité de traduction moyenne, 5 millions de lignes traduites suffisent.



Les jeux de données sont des lignes de texte traduites d'une langue à une autre. Ensuite, le tokenizer divise le texte en jetons et crée des dictionnaires à partir d'eux, triés par la fréquence de la réunion du jeton. Le jeton peut être composé de caractères simples, de syllabes ou de mots entiers.



Après que les jeux de données ont été chargés dans la base de données, ils se sont avérés être beaucoup de mots avec des erreurs ou une mauvaise traduction. Pour obtenir une bonne qualité, ils doivent être fortement filtrés. Vous pouvez également acheter des jeux de données filtrés déjà de haute qualité.



Lorsque le langage est déployé sur l'API, vous devez lui définir une liste de fonctions disponibles (reconnaissance vocale, synthèse vocale, reconnaissance d'image, analyseur de fichier, site, etc.). Pour que les fonctions fonctionnent, ils utilisent une API tierce partie open source - partie tierce partie.

Ensuite, tout se déploie sur l'API. Au fil du temps, un cache a été ajouté. Il fonctionne bien sur les phrases de 1 et 2 mots et peut enregistrer jusqu'à 30% des requêtes.

Nous continuons Ă  travailler


J'ai consacré toute l'année 2018 à résoudre le problème de la traduction de haute qualité dans les principales langues européennes. Je pensais que encore six mois - et tout irait bien. J'étais très limité dans les ressources, seulement 2 personnes étaient impliquées dans les tâches de Data Science. Il fallait aller vite. Il semble que la solution au problème soit quelque chose de simple. Mais le moment lumineux n'est pas venu, je n'étais pas satisfait de la qualité de la traduction. Il a déjà été dépensé environ 450 000 $ gagnés pour d'anciens traducteurs, et il était nécessaire de décider quoi faire ensuite. En lançant ce projet seul et sans investissement, j'ai réalisé combien d'erreurs de gestion j'ai commises. Mais la décision a été prise - allez jusqu'au bout!

À cette époque, j'ai remarqué que dans notre communauté, ils ont commencé à parler d'une nouvelle architecture pour les réseaux de neurones - Transformer. Tout le monde s'est précipité pour former des réseaux de neurones basés sur ce modèle Transformer et a commencé à passer à Python (Tensorflow) au lieu de l'ancien Lua (Torch) .J'ai décidé de l'essayer aussi.

Nous avons également pris un nouveau tokenizer, prétraité le texte, commencé à filtrer et baliser les données différemment, sinon traiter le texte après la traduction pour corriger les erreurs. La règle des 10 mille heures travaillées: l'objectif était en plusieurs étapes, et à un moment donné, j'ai réalisé que la qualité de la traduction était déjà suffisante pour l'utiliser dans l'API pour mes propres applications. Chaque changement a ajouté 2 à 4% de qualité, ce qui n'était pas suffisant pour la masse critique et dans lequel les gens continuent à utiliser le produit sans quitter la concurrence.

Nous avons ensuite commencé à connecter différents outils qui nous ont permis d'améliorer encore la qualité de la traduction: déterminant des entités nommées, translittération, dictionnaires thématiques, système de correction des erreurs de mots. Après 5 mois de ce travail, la qualité des traductions dans certaines langues s'est beaucoup améliorée et les gens ont commencé à se plaindre moins. Ce fut un tournant. Vous pouvez déjà vendre le programme et, du fait que vous disposez de votre propre API de traduction, vous pouvez considérablement réduire les coûts. Vous pouvez augmenter les ventes ou le nombre d'utilisateurs, car les coûts seront uniquement sur le serveur.

Pour former un réseau neuronal, un bon ordinateur était nécessaire. Mais nous avons économisé. Tout d'abord, nous avons loué 20 ordinateurs ordinaires (avec un GTX 1080) et lancé simultanément 20 tests simples sur ceux-ci via le panneau de contrôle Lingvanex. Il a fallu une semaine pour chaque test, c'était long. Pour obtenir une meilleure qualité, vous deviez exécuter d'autres paramètres nécessitant plus de ressources. Il a fallu un cloud et plusieurs cartes vidéo sur une seule machine. Nous avons décidé de louer un service cloud Amazon 8 GPU V100 x 4. C'est rapide, mais très cher. Nous avons commencé le test la nuit et le matin - la facture de 1200 $. À cette époque, il y avait très peu d'options de location de puissants serveurs GPU en plus. J'ai dû abandonner cette idée et chercher des options moins chères. Essayez peut-être d'assembler le vôtre?

Les entreprises appelantes se sont terminées par le fait que nous devions nous-mêmes envoyer une configuration détaillée, et elles l'assemblaient. Ce qui est mieux en termes de «performance / prix» pour nos tâches, personne n'a pu répondre. J'ai essayé de commander à Moscou - je suis tombé sur une entreprise suspecte. Le site était de grande qualité, le service commercial était dans le sujet. Mais ils n'ont pas accepté de virement bancaire, et la seule option de paiement était de jeter de l'argent sur la carte à leur comptable. Ils ont commencé à consulter l'équipe et ont décidé qu'il était possible d'assembler un ordinateur vous-même à partir de plusieurs GPU puissants et à un prix allant jusqu'à 10000 dollars, ce qui résoudra nos problèmes et sera rentable en un mois. Les composants ont littéralement gratté les tripes: ils ont appelé à Moscou, commandé quelque chose en Chine, quelque chose à Amsterdam. Un mois plus tard, tout était prêt.

Début 2019, j'ai finalement assemblé cet ordinateur à la maison et commencé à effectuer de nombreux tests, sans me soucier de ce que je dois payer pour le loyer. En espagnol, j'ai commencé à remarquer que la traduction est proche de la traduction Google de la métrique BLEU. Mais je ne comprenais pas cette langue et j'ai mis le modèle du traducteur anglais-russe à s'entraîner pour la nuit pour comprendre où j'étais. L'ordinateur a bourdonné et frit toute la nuit, il était impossible de dormir. Il était nécessaire de s'assurer qu'il n'y avait pas d'erreurs dans la console, car tout se bloquait périodiquement. Dans la matinée, j'ai effectué un test pour traduire 100 phrases de 1 à 100 mots et j'ai constaté que c'était une bonne traduction, y compris sur de longues lignes. Cette nuit a tout changé. J'ai vu la lumière au bout du tunnel que vous pouvez encore un jour atteindre une bonne qualité de traduction.

Amélioration de la qualité des applications


Ayant gagné de l'argent sur un traducteur iOS avec un bouton et une fonction, j'ai décidé d'améliorer sa qualité, ainsi que de faire une version pour Android, Mac OS, Windows Desktop. J'espérais que lorsque je disposerais de ma propre API, je terminerais le développement d'applications et pénétrerais d'autres marchés. Pendant que je résolvais le problème de mon API, les concurrents sont allés beaucoup plus loin. Certaines fonctions étaient nécessaires, pour le plaisir, ce sera mon traducteur qui téléchargera.

La première chose que j'ai décidé de faire était la traduction vocale pour les applications mobiles sans accès Internet. C'était un problème personnel. Par exemple, vous allez en Allemagne, téléchargez uniquement le package allemand sur votre téléphone (400 Mo) et obtenez une traduction de l'anglais vers l'allemand et vice versa. En fait, le problème de l'Internet dans les pays étrangers est aigu. Le Wi-Fi n'est pas le cas, ou il est protégé par mot de passe ou simplement lent, en conséquence, il est impossible de l'utiliser. Bien qu'il existe des milliers d'applications de traduction de haute qualité qui fonctionnent uniquement via Internet à l'aide de l'API Google, même en 2017.

Étant donné que beaucoup avaient des problèmes avec la version Lua (Torch) d'OpenNMT en raison du langage peu répandu, les fondateurs ont transféré la logique du script translate.lua vers la version C ++ (CTranslate), qui a été utilisée pour des expériences de traduction plus pratiques. Sur la version Lua, il était possible de former des modèles, sur la version C, pour courir. En mai 2017, il était déjà possible de l'utiliser d'une manière ou d'une autre comme base de production pour les applications.

Nous avons porté CTranslate pour travailler pour les applications et tout mettre en open source.

Voici un lien vers ce fil:

github.com/hunter-packages/onmt

Le portage de CTranslate sur différentes plateformes n'est que la première étape. Il était nécessaire de comprendre comment faire fonctionner des modèles hors ligne de petite taille et de qualité normale sur des téléphones et des ordinateurs. Les premières versions des modèles de traduction occupaient 2 Go dans la RAM du téléphone, ce qui était absolument sans valeur.

J'ai trouvé des gars en Espagne avec une bonne expérience dans les projets de traduction automatique. Pendant environ 3 mois, nous avons mené conjointement des travaux de R&D dans le domaine de la réduction de la taille du modèle neuronal à traduire, afin d'atteindre 150 Mo par paire, puis de les exécuter sur des téléphones portables.
La taille a dû être réduite de manière à inclure autant d'options que possible pour traduire des mots de longueurs et de sujets différents dans une certaine taille de dictionnaire (par exemple, 30 000 mots).

Plus tard, le résultat de notre recherche a été rendu public et présenté à l'Association européenne de traduction automatique à Alicante (Espagne) en mai 2018, et l'un des membres de l'équipe a soutenu un doctorat à ce sujet.

rua.ua.es/dspace/bitstream/10045/76108/1/EAMT2018-Proceedings_33.pdf?fbclid=IwAR1BxipmZMR8Rt0d32gcJ7BaFt1Tf1UEm9LkJCYytBJLgdtx3ujAPFCwE80

Lors de la conférence, de nombreuses personnes souhaitaient acheter un produit, mais jusqu'à présent, une seule paire de langues était prête (anglais - espagnol). La traduction hors ligne des neurones pour téléphones était prête en mars 2018 et il était possible de la faire dans toutes les autres langues jusqu'à l'été. Mais en vertu du contrat, je n'ai pas pu obtenir les sources et les outils utilisés pour ce faire, pour faire un traducteur hors ligne dans d'autres langues. Il fallait lire attentivement le contrat. Seul, je n'ai pas pu reproduire rapidement les résultats dans d'autres langues. J'ai dû suspendre cette fonction. Un an plus tard, je suis retourné vers elle et l'ai terminé.

En plus de traduire du texte, de la voix et des images, il a été décidé d'ajouter une traduction des appels téléphoniques avec transcription que les concurrents n'avaient pas. Il y avait un calcul selon lequel les gens appellent souvent le support ou pour des questions commerciales dans différents pays, en outre, sur un téléphone mobile ou fixe. Celui à qui l'appel est adressé n'a pas besoin d'installer l'application. Cette fonction nécessitait beaucoup de temps et d'argent, il a donc été décidé par la suite de la placer dans une application distincte de la principale. C'est ainsi qu'est né le Phone Call Translator .

Les applications de traduction ont eu un problème - elles ne sont pas utilisées tous les jours. Il n'y a pas beaucoup de situations dans la vie où vous devez traduire quotidiennement. Mais si vous étudiez la langue, l'utilisation d'un traducteur devient fréquente. Pour apprendre les langues, nous avons créé une fonction de cartes, lorsque des mots sont ajoutés aux signets sur le site via une extension pour le navigateur ou dans des sous-titres pour le film, puis les connaissances sont consolidées en utilisant l'application de chat mobile ou l'application de colonne intelligente qui vérifiera les mots sélectionnés. Toutes les applications Lingvanex sont interconnectées par un seul compte, vous pouvez donc commencer à traduire sur une application mobile et continuer sur votre ordinateur.

Ajout de conversations vocales avec traduction. Cela sera utile pour les groupes de touristes, lorsque le guide peut parler sa propre langue et que chacun des visiteurs écoutera la traduction. Et à la fin - la traduction de gros fichiers sur le téléphone ou l'ordinateur.

Projet Backenster


Pendant 7 ans, j'ai reçu 35 millions de téléchargements sans frais publicitaires et gagné plus d'un million de dollars. Près de la moitié d'entre eux sont traducteurs. Ce sont des applications de test pour apprendre le marketing mobile. En raison du grand nombre d'erreurs, des millions d'utilisateurs sont entrés et sortis. Ayant acquis l'expérience nécessaire, je décide de créer un petit sous-projet interne Backenster pour la gestion des applications, de la publicité et de l'analyse, afin de ne pas répéter les erreurs du passé sur des traducteurs de haute qualité et de gagner autant que possible.

Grâce à ce système, je vais rediriger les utilisateurs de mes anciennes applications de traduction vers de nouvelles, car il n'y a pas d'argent pour acheter du trafic. Quelque part ailleurs, 5 à 10 millions d'anciennes applications sont restées sur les téléphones. Lorsque les applications sont prêtes, il ne reste plus qu'à cliquer sur "Démarrer". Cela coûtera beaucoup moins cher que d'attirer le même nombre d'utilisateurs moyennant des frais. Peu à peu, un système de gestion des tests, des abonnements, des mises à jour, de la configuration, des notifications, un médiateur de la publicité, etc., ainsi que la possibilité de faire de la publicité croisée pour les applications mobiles dans les extensions de navigateur, les chatbots, les ordinateurs de bureau, les assistants vocaux et vice versa, ont été ajoutés. J'ai décidé de prévoir tous les problèmes qui se sont posés pendant ce temps avec les candidatures.



Perspective et stratégie


Pour créer une API pour vos applications et investir beaucoup d'argent, vous devez comprendre le volume et les perspectives du marché de la traduction automatique. En 2017, il était prévu que le marché atteindrait 1,5 milliard de dollars d'ici 2023, bien que le volume du marché pour tous les transferts soit de 70 milliards de dollars (pour 2023).

Pourquoi une telle course - environ 50 fois?

Disons que le meilleur traducteur automatique traduit maintenant bien 80% du texte. Les 20% restants doivent être modifiés par une personne. Les coûts de traduction les plus importants sont la relecture, c'est-à-dire les salaires des personnes.

Une augmentation de la qualité de la traduction même de 1% (jusqu'à 81% dans notre exemple) peut réduire au sens figuré le coût de la relecture de texte de 1%. 1% de la différence entre le marché de tous les transferts moins celui de la machine sera (70 - 1,5 = 68,5 milliards de dollars) ou 685 millions de dollars déjà. Les chiffres et le calcul ci-dessus sont donnés approximativement pour transmettre l'essence.

Autrement dit, une amélioration de la qualité de 1% peut permettre aux grandes entreprises d'économiser considérablement sur les services de traduction. À mesure que la qualité de la traduction automatique se développe, elle remplacera de plus en plus le marché de la traduction manuelle et réduira les coûts salariaux. Il n'est pas nécessaire d'essayer de couvrir toutes les langues, vous pouvez choisir une paire populaire (anglais-espagnol) et l'un des domaines (médecine, métallurgie, pétrochimie, etc.). 100% qualité - la traduction automatique parfaite sur tous les sujets - inaccessible dans un proche avenir. Et chaque pourcentage ultérieur d'amélioration de la qualité sera plus difficile.

Cependant, cela n'empêche pas le marché de la traduction automatique d'occuper une part importante du marché total d'ici 2023 (par analogie avec DeepL, il a capté imperceptiblement 10% du marché de Google), car les grandes entreprises testent quotidiennement diverses API de traducteur. Et l'amélioration de la qualité de l'un d'entre eux d'un pourcentage (pour n'importe quelle langue) leur permettra d'économiser plusieurs millions de dollars.
La stratégie des grandes entreprises de créer leurs propres horaires d'ouverture a commencé à porter ses fruits. Il y a plus de startups, d'articles scientifiques et de personnes dans l'industrie, ce qui nous a permis de faire basculer le marché et d'obtenir une meilleure qualité de traduction, augmentant nos prévisions pour le marché de la traduction automatique.

Chaque année, des concours sont organisés sur les tâches de la PNL, où les entreprises, les startups et les universités se disputent la meilleure traduction dans certaines paires de langues.

http://statmt.org/wmt18/

En analysant la liste des gagnants, il est certain que les petites ressources peuvent obtenir d'excellents résultats.

Ouverture de la société


Depuis plusieurs années, le projet s'est développé à plusieurs reprises. Des applications sont apparues non seulement pour les plates-formes mobiles, mais aussi pour les ordinateurs, les appareils portables, les messageries instantanées, les navigateurs, les assistants vocaux. En plus de traduire du texte, une traduction de la voix, des images, des fichiers, des sites et des appels téléphoniques a été créée. Au départ, j'avais prévu de faire mon API de traduction à utiliser uniquement pour mes applications. Mais j'ai décidé de l'offrir à tout le monde. Les concurrents sont allés de l'avant et il a fallu suivre.

Jusqu'à cette époque, je gérais tout seul en tant qu'entrepreneur individuel, en embauchant des gens pour externaliser. Mais la complexité du produit et le nombre de tâches ont commencé à croître rapidement, et il est devenu évident que vous devez déléguer des fonctions et embaucher rapidement des personnes à votre propre équipe dans votre bureau. J'ai appelé un ami, il a quitté son emploi et a décidé d'ouvrir Lingvanex en mars 2019.

Jusqu'à ce moment, je créais un projet sans publicité nulle part, et quand j'ai décidé de constituer mon équipe, j'ai rencontré un problème de recherche. Personne ne croyait que cela puisse être fait du tout et ne comprenait pas pourquoi. J'ai dû interviewer beaucoup de gens et chacun a parlé pendant 3 heures de milliers de détails non évidents. Lorsque le premier article sur le projet est sorti, c'est devenu plus facile. On m'a toujours posé une question:

la première question sonne toujours "Qu'est-ce que vous valez mieux que Google?"

À l'heure actuelle, notre objectif est d'atteindre la qualité de la traduction Google d'un thème commun dans les principales langues européennes et asiatiques et, par la suite, de fournir des solutions pour:

1) La traduction de texte et de sites via notre API est trois fois moins chère que les concurrents, offrant un excellent service d'assistance et une intégration facile. Par exemple, le coût de la traduction Google est de 20 $ par million de caractères, ce qui est très cher avec des volumes importants de

2) Traduction thématique de haute qualité de documents sur certains sujets (médecine, métallurgie, droit, etc.) par API, y compris l'intégration dans des outils pour les professionnels traducteurs (tels que SDL Trados)

3) Intégration dans les processus d'affaires des entreprises pour exécuter des modèles de traduction sur leurs serveurs sous notre licence. Cela vous permet de préserver la confidentialité des données, de ne pas dépendre du volume du texte traduit et d'optimiser la traduction pour les spécificités d'une entreprise particulière.

Vous pouvez améliorer la qualité de la traduction par rapport à vos concurrents pour des paires de langues ou des sujets spécifiques. Tu peux faire n'importe quoi. C'est une question de ressources de l'entreprise. Avec un investissement suffisant, il n'y a pas de problème. Quoi et comment faire - on sait que vous avez juste besoin de mains et d’argent.

En fait, le marché de la PNL se développe très rapidement à mesure que la reconnaissance, l'analyse de la parole, la traduction automatique s'améliorent et peuvent apporter de bons bénéfices à une petite équipe. Tout le battage médiatique ici commencera dans 2-3 ans, lorsque la promotion du marché par les grandes entreprises d'aujourd'hui portera ses fruits. Une série de fusions / acquisitions va commencer. L'essentiel en ce moment est d'avoir un bon produit avec un public que vous pouvez vendre.

Total


Pendant tout ce temps, les applications de test ont rapporté plus d'un million de dollars, dont la plupart ont été dépensés pour faire votre propre traducteur. Maintenant, il est évident que tout pourrait être fait beaucoup moins cher et mieux. De nombreuses erreurs de gestion ont été commises, mais c'est de l'expérience, et il n'y a plus eu personne à consulter. L'article décrit une très petite partie de cette histoire, et parfois il peut ne pas être clair pourquoi certaines décisions ont été prises. Posez des questions dans les commentaires.

Pour le moment, nous n'avons pas atteint la qualité de la traduction Google, mais je ne vois aucun problème à le faire si l'équipe compte au moins quelques spécialistes du traitement du langage naturel.
Maintenant, notre traducteur fonctionne mieux de l'anglais vers l'allemand, l'espagnol et le français.

Liens vers de nouveaux programmes développés sur 3 ans et dans lesquels de l'argent a été investi. Si quelqu'un veut voir les anciennes applications de test qui ont été discutées au début de l'article (où l'argent a été gagné et 35 millions de sauts) - écrivez en privé.

Traducteur pour iOS


Traducteur pour Android


Traducteur pour Mac OS


Traducteur pour Windows


Traducteur pour Chrome


Traducteur pour Telegram



Ce lien se trouve

DĂ©mo de l'API de traduction



L'équipe a également besoin d'un chef de produit (applications mobiles) et d'un programmeur Python ayant de l'expérience dans les projets PNL.

Si vous avez des idées de partenariats et d'offres conjointes - écrivez dans un e-mail personnel, ajoutez à Facebook, LinkedIn.

All Articles