我是如何在没有经验和人脉的情况下获得1,000,000美元的,然后又花了他们来做我的翻译

一切如何开始


这个故事始于15年前。在首都当程序员的时候,我积累了金钱并辞掉了工作,以便以后创建自己的项目。为了省钱,他回到了家乡,在那里他为一个学生网站,一个交易程序和手机游戏工作。但是由于缺乏业务经验,这没有产生收入,因此很快关闭了这些项目。我不得不再次去首都找份工作。这个故事重复了好几次。

当我的钱再次用完时,危机就来了。我找不到工作,情况变得很危急。现在是时候以清醒的眼光看待所有事物了。我必须诚实地向自己承认,我不知道该选择哪些壁ni做生意。创建自己喜欢的项目无处可去。

我唯一能做的就是iOS应用程序。在IT公司工作了数年后,我获得了一些经验,因此决定进行许多简单的,根本不同的应用程序(游戏,音乐,绘画,健康的生活方式,语言学习),并测试在哪些方面没有竞争。准备了一组类和库,可以快速创建有关各种主题的简单应用程序(2d游戏,gps跟踪器,简单实用程序等)。他们大多数人有几张图片,2个按钮和一个功能。但这足以测试这个想法,以及从中赚钱的容易程度。例如,一个正在运行的应用跟踪一个人的速度,行进的距离并计算卡路里。我花了一年半的时间创建了数百个简单的应用程序。由于购买了股票图形以及重新使用了源代码,因此能够实现这种速度。



最初,这些应用程序是免费的。然后,我添加了广告和应用内购买,选择了关键字和明亮的图标。应用程序开始下载。

当收入达到3万美元/月时,我决定告诉一个在大型杂货公司工作的朋友,我能够在测试应用程序上实现这样的数字,并建议一起创建它们。他回答说,他们只有一个应用程序-一个游戏,每月收入6万美元,用户2.5万,而我的收入为3万美元,用户为20万。这完全改变了我的看法。事实证明,创建一个高质量的应用程序比创建一百个低质量的应用程序更好

我知道使用高质量的产品可以赚到数十倍的收入,但是我一个人在一个小城市里,没有经验和设计师以及营销人员的团队。我需要支付租房和谋生的费用。只需测试应用程序即可测试市场壁ni和广告策略,以了解哪些应用程序以及如何创建它们。碰巧其中一些人开始带来丰厚的收入。现在,简单应用程序的主题早已消亡,不再赚钱。

一些应用程序在利润方面有很大的不同-这些是翻译器,运输工具,音乐程序(模拟弹奏钢琴,鼓或例如吉他和弦,演奏器)的应用程序,以及简单的逻辑游戏。

在测试各种类型的游戏时,我意识到具有较长会话时间和用户参与度(例如“ 2048”)的游戏可以在很长一段时间内带来很多收益。但是起初并不明显。因此,我创建了诸如滑雪者GPS追踪器之类的测试平台,并在关键字中添加了诸如高雪维尔这样的流行滑雪胜地的名称。然后,他很高兴点击广告带来了2美元的收入。但这是一项短期,不可扩展的策略。

然后我注意到,在短短一个月内,翻译人员下载了超过100万次。尽管它们在该类别的排名中大约位于第100位,但事实并非如此。

音乐应用程序带来了许多飞跃,但是由于用户的参与,它们的前景不太乐观。他们的用户需要被高频关键字所吸引,并且在这个利基市场中的用户并不多:那些正在寻找吉他应用程序的人在搜索中输入“ guitar”,“ bass guitar”,“ chords”等。很难找到此类主题的许多同义词。因此,用户将注意力集中在高频请求上,迟早他们的介入将是昂贵的。译者是不同的。

世界上有成百上千种语言,人们不仅使用通用词``翻译''输入查询,还用几个词来解决他们的问题:``翻译成法语'',``从中文翻译''。如果有很多请求,您可以仅通过中频关键字(ASO)吸引用户。利基市场被证明是充满希望的,尤其是因为我喜欢翻译这个话题。

后来,使用Google API提供的翻译创建了大约40个简单的翻译器。它的成本是每翻译100万个字符20美元。逐渐出现了改进的应用程序版本,其中添加了广告,应用程序内购买和语音翻译。

赚了钱,我搬到明斯克买了房子。当时,我有50-70个翻译应用程序和500万次下载。但是随着用户的增长,付费的Google Translate API的成本增加了。该业务的盈利能力已严重下降。付费用户一次翻译了1000个字符的块,这迫使对请求引入限制。当他们受到翻译的限制时,他们写了不好的评论并退还了这笔钱。 70%的收益用于支出的时候到了。由于翻译量很大,这项业务前景不大。为了收回成本,有必要在应用程序中添加大量广告,这总是使用户感到恐惧。它需要制作自己的API进行翻译,而这很可能并不便宜。

我试图向初创公司和IT社区寻求建议和投资,但没有找到支持。大多数人不明白为什么要在已经有领导者的市场-Google翻译中工作。

除了Google之外,还有多家公司提供了翻译API。我准备付3万美元购买40种语言的翻译技术许可。这将使我能够以固定价格无限次转换,并为服务器上的任意数量的用户提供服务。但是作为回应,他们打电话给我,金额要高出几倍。太贵了。决定尝试制作自己的翻译技术。我试图吸引朋友寻求发展,但那时他们中的大多数人已经有了家人,小孩和贷款。每个人都希望自己能享受高薪的稳定和生活,而不是去创业。他们还不明白,如果Google拥有出色的,复杂的翻译应用程序和API,为什么还要创建翻译器。我没有公开演讲的经验,魅力和超酷的原型应用程序引起人们的兴趣。在测试翻译应用程序上进行的30万美元收益分析并没有使任何人感到惊讶。

我找了一位在明斯克拥有一家外包公司的朋友。在2016年底,他为我分配了一个团队。我希望我可以在六个月内基于开源项目解决该问题,以免依赖Google的API。

在我翻译的途中


工作已经开始。在2016年,我们发现了几个开源项目-Apertium,Joshua和Moses。这是一种统计机器翻译,适用于简单文本。这些项目得到3到40人的支持,并且花了很长时间才找到有关它们的问题的答案。在弄清楚并仍将其运行以进行测试之后,很明显,我们需要功能强大的服务器和高质量的数据集,而这是昂贵的。即使我们在硬件和一套翻译对的质量数据集上花了钱,质量仍然有很多不足之处。

从技术上讲,它并没有归结为“下载数据集和训练”方案。原来,我们甚至不知道有100万个细微差别。我们尝试了更多资源,但没有取得良好的效果。但是谷歌和微软没有透露他们的成就。尽管如此,工作仍在继续,自由职业者定期联系在一起。

2017年3月,我们偶然发现了一个名为Open NMT的项目。这是机器翻译市场的领导者之一Systran与哈佛大学的共同开发。该项目刚刚启动,并已经基于新技术-神经网络提供了翻译。

现代机器翻译技术属于大公司,所以它们是封闭的。小玩家意识到渗透到这个世界有多么困难,所以不要做这样的尝试。这阻碍了市场的发展。领导者之间的翻译质量在很长一段时间内相差无几。显然,大公司还面临着发烧友,科学论文,初创公司和开源项目的不足,以寻求新想法和雇用人才。

因此,Systran进行了全新的操作:在开源中奠定了基础,以便像我这样的发烧友可以参与这项工作。他们创建了一个论坛,他们的专家开始免费帮助新移民。它带来了丰厚的回报:初创企业,有关翻译的科学工作开始出现,因为每个人都可以以此为基础并进行实验。 Systran领导了这个社区。然后其他公司加入。

那时还没有普遍存在的神经翻译,Open NMT在这一领域提供了基础,其质量优于统计机器翻译。我和世界各地的其他人都可以采用这些技术,并向专家寻求建议。他们乐于分享他们的经验,这使我理解了朝哪个方向发展。

我们以OpenNMT为基础。这种情况发生在2017年初,当时它仍然是“原始的”,除了基本功能之外,没有任何其他内容。所有这些都在Lua(Torch)上,纯粹用于学术研究。发现了许多错误,所有操作缓慢,不稳定并且在轻负载下崩溃了。它根本不适合生产。然后,在一般的聊天中,我们所有人在一起进行测试,发现错误,分享想法,逐渐提高稳定性(那时我们大约有100人)。起初,我想知道:Systran为什么会如此壮大竞争对手?但是随着时间的流逝,随着越来越多的公司开始为在开源中处理自然语言奠定基础,我了解了游戏规则。

即使每个人都具有处理大型数据集的计算能力,在市场上寻找NLP(自然语言处理)专家的问题也很迫切。在2017年,这个主题的发展远不及图像和视频处理。更少的数据集,科学论文,专家,框架等等。能够开展业务并关闭NLP研究论文中任何本地壁ni的人甚至更少。像Google这样的顶级公司和较小的Systran播放器都需要获得同类别播放器相比的竞争优势。

他们如何解决这个问题?

乍一看,这似乎很奇怪,但是为了彼此竞争,他们决定向市场引入新的参与者(竞争者),并且为了让他们出现在市场中,您需要摇摆不定。入门门槛仍然很高,并且对语音处理技术的需求正在增长(语音助手,聊天机器人,翻译,语音识别和分析等),仍然需要购买一定数量的初创公司以巩固自己的位置还没。

在公共领域,由Google,Facebook和阿里巴巴的团队发表了科学作品。从他们那里,他们的框架和数据集以开源形式布置。创建论坛时会回答问题。

大型公司对我们这样的初创公司感兴趣,他们正在开发,占领新的利基市场并表现出最大的增长。他们乐于购买NLP初创公司以增强其大公司。

的确,即使您掌握了所有数据集和算法并告诉您,也并不意味着您将成为NLP领域的高质量翻译人员或其他初创公司。而且即使您这样做了,也远非要占领很大一部分市场。因此,您需要帮助,如果某人成功,请购买或合并。

2018年3月,Systran邀请了整个社区到巴黎交流经验,并举办了免费的大师班,介绍翻译领域的初创企业面临的主要问题。每个人都有兴趣看到彼此的生活。

每个人都有各种各样的项目。有人创建了一个学习英语的机器人,您可以像一个人一样说话。其他人使用openNMT来总结文本。创业公司的很大一部分代表了SDL Trados Studio的插件,这些插件是针对特定主题(医学,建筑,冶金等)或一种语言量身定制的,可以帮助翻译人员节省编辑译文的时间。

除了发烧友外,来自Ebay和Booking的人还到达了巴黎,他们在与我们相同的平台上创建了口译员,但为翻译拍卖和酒店描述进行了优化。

同样在2017年5月,Facebook公布了将Fairseq机器翻译成开源以及经过测试的模型的基础。但是我们决定留在OpenNMT上,观察社区的发展。

DeepL的历史


在2017年9月,通过分析竞争对手,我发现了DeepL。他们只是从那时开始,仅提供7种语言的翻译。 DeepL被定位为专业翻译人员的工具,可帮助您减少机器翻译后的校对时间。即使翻译质量发生微小变化,也可以为翻译公司节省大量资金。他们会不断监控来自不同供应商的机器翻译API,因为每个人的许多语言对的质量都不一样,而且没有一个领导者。虽然语言数量-最主要的是Google。

为了证明翻译的质量,DeepL决定以某些语言运行测试。

techcrunch.com/2017/08/29/deepl-schools-other-online-translators-with聪明的机器学习

当专业翻译从Google,Microsoft,DeepL,Facebook选择最佳翻译时,通过盲测进行质量评估。根据结果​​,DeepL获胜,评审团将其翻译评为最“文学”。

这是怎么发生的?

DeepL的创始人拥有自己的创业公司Linguee-最大的翻译文本链接数据库。它们很可能具有由解析器组装的大量数据集,而要对其进行训练,则需要更多的计算能力。

在2017年,他们发表了一篇文章,指出他们在冰岛组装了一台5 petFlops超级计算机(当时在性能方面它是世界第23位)。训练大型质量模型只是时间问题。那时,似乎即使我们购买高质量的数据集,如果没有这样的超级计算机,我们将永远无法与它们竞争。

www

。 Nvidia推出了一款DGX-2计算机,其大小相当于床头柜,性能为2 petPlops(FP16),现在可以每月5,000美元的价格租用。

www.nvidia.com/zh-cn/data-center/dgx-2

有了这样的计算机,您可以快速地使用庞大的数据集训练模型,并且还可以在API上保持较大的负担。这极大地改变了整个机器学习创业市场的力量平衡,并允许小公司在处理大数据领域与巨头竞争。在性价比方面,它是市场上最好的产品。

我开始寻找有关DeepL统计信息。在2018年,谷歌每月有5亿用户。 DeepL有5000万(文章发布于2018年12月12日)。

slator.com/ma-and-funding/benchmark-capital-takes-13-6-deepl-as-usage爆炸式增长

事实证明,到2018年底,每月Google受众中有10%使用DeepL,并且没有在任何地方进行特别的广告宣传。在短短一年多的时间里,他们通过口耳相传占领了10%的市场。

我想过这个问题。如果DeepL在20人的团队中击败了Google,并在2017年在5 petaFlops中拥有一辆汽车,而现在您可以廉价地在2 petaFlops中租一辆汽车并购买高质量的数据集,那么要实现Google质量将有多困难?

Lingvanex控制面板


为了快速处理翻译任务,而不是从控制台运行测试,创建了一个仪表板,允许您执行所有任务,从准备和过滤数据到将翻译测试部署到生产。在下图中:右侧是正在训练模型的任务和GPU服务器的列表。中间是神经网络的参数,下面是将用于训练的数据集。



一种新语言的工作始于数据集的准备。我们从Wikipedia,欧洲议会会议,Paracrawl,Tatoeba等开放源代码中获取它们,要获得平均翻译质量,500万条翻译行就足够了。



数据集是从一种语言翻译成另一种语言的文本行。然后,令牌生成器将文本拆分为令牌,并根据令牌创建会议的字典,并按令牌开会的频率排序。令牌可以是单个字符,音节或整个单词。



将数据集加载到数据库中后,结果发现它们是很多带有错误或翻译不正确的单词。为了获得良好的质量,需要对其进行严格过滤。您也可以购买已经高质量的过滤数据集。



将语言部署到API后,您需要为其设置可用功能的列表(语音识别,语音合成,图像识别,文件解析器,站点等)。为了使这些功能正常工作,他们使用了第三方API部分开源-部分第三方。

然后将其全部部署到API。随着时间的流逝,添加了一个缓存。它适用于1词和2词短语,最多可保存30%的查询。

我们继续努力


我整个2018年都花在解决主要欧洲语言的高质量翻译问题上。我以为再过六个月,一切都会解决。我的资源非常有限,只有2个人参与了数据科学任务。必须快速行动。解决问题的方法似乎很简单。但是光明的时刻没有到来,我对翻译的质量不满意。它已经花了大约45万美元花在了老翻译上,并且需要就如何进行做出决定。我独自一人启动该项目而无需投资,我意识到自己犯了多少管理错误。但是决定已经决定了-到最后!

这时,我注意到在我们社区中,他们开始谈论神经网络的新架构-变压器。每个人都急于训练基于此Transformer模型的神经网络,并开始改用Python(Tensorflow)而不是旧的Lua(Torch),我决定也尝试一下。

我们还使用了一个新的标记器,对文本进行预处理,开始以不同的方式过滤和标记数据,否则在翻译后处理文本以纠正错误。一万小时的规则起作用:达到目标有许多步骤,在某个时候,我意识到翻译质量已经足以在我自己的应用程序的API中使用。每次更改都会增加2-4%的质量,对于临界质量而言这还不够,而且人们可以在不离开竞争的情况下继续使用该产品。

然后,我们开始连接各种工具,这些工具使我们能够进一步提高翻译质量:命名实体的决定因素,音译,主题词典,纠正单词错误的系统。经过5个月的工作,某些语言的翻译质量变得更好了,人们的抱怨也开始减少了。这是一个转折点。您已经可以出售该程序,并且由于您拥有自己的翻译API,因此可以大大降低成本。您可以增加销售量或用户数量,因为这些成本仅在服务器上。

为了训练神经网络,需要一台好的计算机。但是我们救了。首先,我们租用了20台普通计算机(带有一台GTX 1080),并通过Lingvanex控制面板同时对它们进行了20次简单测试。每次测试花了一个星期,时间很长。为了获得更好的质量,您必须使用需要更多资源的其他参数来运行。一台机器上花了云和更多的视频卡。我们决定租用云服务Amazon 8 GPU V100 x4。它速度很快,但是非常昂贵。我们在晚上和早上开始测试-费用为1200美元。当时,除了功能强大的GPU服务器外,几乎没有其他租赁选项。我不得不放弃这个想法,寻找更便宜的选择。也许尝试组装自己的?

呼叫公司最终以我们自己必须发送详细的配置,然后他们将其组装为事实。就我们的任务而言,“性能/价格”哪个更好,没人能回答。试图在莫斯科订购-偶然发现了一些可疑的公司。网站质量很高,销售部门负责。但是他们不接受银行转帐,唯一的付款选择是在卡上把钱扔给他们的会计师。他们开始与团队进行协商,并决定可以用几万个功能强大的GPU自行组装计算机,价格高达一万美元,这将解决我们的问题并在一个月内得到回报。零件从字面上直截了当地:他们打电话到莫斯科,在中国订购了东西,在阿姆斯特丹订购了东西。一个月后,一切准备就绪。

在2019年初,我终于在家里组装了这台计算机并开始进行许多测试,而不必担心我需要支付租金。在西班牙语中,我开始注意到该翻译与BLEU指标的Google翻译非常接近。但是我听不懂这种语言,因此设置了英语-俄语翻译的模型来训练通宵达旦,以了解我在哪里。电脑整夜嗡嗡作响,无法入睡。有必要确保控制台中没有错误,因为所有内容都会定期挂起。早上,我进行了一次测试,翻译了100个句子,长度从1到100个单词,结果证明这是一个很好的翻译,包括长行翻译。今晚改变了一切。我看到隧道尽头的光,总有一天您仍然可以达到良好的翻译质量。

提高应用程序质量


我通过使用一个按钮和一个功能的iOS转换器赚钱后,我决定提高其质量,并制作适用于Android,Mac OS和Windows桌面的版本。我希望当我拥有自己的API时,我将完成应用程序的开发并进入其他市场。在我解决API问题期间,竞争对手走得更远。需要一些功能,因此将由我的翻译下载。

我决定要做的第一件事是在没有Internet访问的情况下为移动应用程序进行语音翻译。这是个人问题。例如,您去德国,仅将德语包下载到您的手机(400 mb)中,然后将英语翻译成德语,反之亦然。实际上,国外的互联网问题非常严重。 Wifi要么没有启用,要么受密码保护或速度很慢,因此无法使用它。尽管有成千上万的高质量翻译器应用程序只能在使用Google API的互联网上运行,即使在2017年也是如此。

由于很多人由于语言的使用不太广泛而对OpenNMT的Lua(Torch)版本遇到了问题,因此创始人将translate.lua脚本的逻辑转移到了C ++版本(CTranslate),该版本用于更方便的翻译实验。在Lua版本上,可以训练模型在C版本上运行。到2017年5月,已经有可能以某种方式将其用作应用程序的生产基础。

我们将CTranslate移植到应用程序中,并将其全部开源。

这是此线程的链接:

github.com/hunter-packages/onmt

将CTranslate移植到不同的平台只是第一步。有必要了解如何使小尺寸和正常质量的离线模型在电话和计算机上工作。翻译模型的第一个版本在手机的RAM中占用了2GB,这绝对是一文不值。

我在西班牙找到了在机器翻译项目方面经验丰富的人。在大约3个月的时间里,我们共同进行了研究,以缩小用于翻译的神经元模型的大小,以实现每对150 mb的大小,然后在手机上运行。
大小必须减小,以包括尽可能多的选项,以将不同长度和主题的单词翻译成某个字典大小(例如3万个单词)。

后来,我们的研究结果公开发​​布并于2018年5月提交给位于西班牙阿利坎特的欧洲机器翻译协会,并且其中一名团队成员为其辩护了博士学位。

rua.ua.es/dspace/bitstream/10045/76108/1/EAMT2018-Proceedings_33.pdf?fbclid=IwAR1BxipmZMR8Rt0d32gcJ7BaFt1Tf1UEm9LkJCYytBJLgdtx3ujAPFCwE80

在会议上,许多人想购买产品,但是到目前为止,只有一种语言对可用(英语-西班牙语)。手机神经元的离线翻译已于2018年3月准备就绪,并且有可能在夏天之前以所有其他语言进行翻译。但是根据合同,我无法获得用来做其他语言的离线翻译的资源和工具。有必要仔细阅读合同。我独自一人无法迅速用其他语言重现结果。我不得不暂停此功能。一年后,我回到了她并完成了工作。

除了翻译文本,语音和图片外,还决定添加竞争对手没有的带有转录的电话翻译。据估算,人们经常通过移动电话或固定电话致电不同国家的支持或业务问题。呼叫所针对的那个人不需要安装应用程序。此功能需要大量时间和成本,因此后来决定将其与主要应用程序放在单独的应用程序中。这就是电话翻译器的出现

翻译应用程序存在一个问题-并非每天都在使用。生活中没有很多情况需要每天翻译。但是,如果您学习语言,就会经常使用翻译器。为了学习语言,我们创建了一种卡片功能,将单词通过浏览器的扩展名或电影的字幕添加到站点上的书签中,然后使用移动聊天机器人应用程序或智能列应用程序来巩固知识,该应用程序将检查所选单词。所有Lingvanex应用程序都通过一个帐户互连,因此您可以开始在移动应用程序上进行翻译并在计算机上继续进行。

还添加了带有翻译的语音聊天。当导游会说自己的语言,并且每个访客都会听翻译时,这对游客团体很有用。最后-手机或计算机上大文件的翻译。

Backenster项目


在过去的7年中,我获得了3500万次下载,而没有广告费,并且获得了超过100万美元的收入。其中几乎一半是翻译。这些是学习移动营销的测试应用程序。由于存在大量错误,成千上万的用户都来来去去。在获得必要的经验之后,我决定创建一个小的内部Backenster子项目来管理应用程序,广告和分析,以免在高品质的翻译人员上重蹈覆辙,并尽可能多地赚钱。

通过该系统,我将把旧翻译器应用程序的用户重定向到新的应用程序,因为没有钱购买流量。手机上还有5到1千万个旧应用程序。准备好应用程序后,仅需单击“开始”即可。它比吸引相同数量的用户收费要便宜很多倍。逐渐地,添加了一个用于管理测试,订阅,更新,配置,通知,广告中介等的系统,以及在浏览器扩展,聊天机器人,桌面,语音助手(反之亦然)中交叉移动应用程序的功能。我决定预见在这段时间内应用程序出现的所有问题。



远景与策略


为您的应用程序创建API并投入大量资金,您需要了解机器翻译市场的规模和前景。 2017年,据预测,到2023年,市场规模将达到15亿美元,尽管所有转账的市场规模将达到700亿美元(2023年)。

为什么要运行-大约50次?

假设最好的机器翻译器现在可以很好地翻译80%的文字。其余的20%必须由一个人编辑。最大的翻译成本是校对,即人民的工资。

甚至将翻译质量提高1%(在我们的示例中最高达到81%)都可以使校对文本的成本降低1%。所有转让市场减去一台机器之间的差额的1%将是(70-1.5 = 685亿美元)或6.85亿美元。上面给出的数字和计算近似地传达了本质。

也就是说,即使质量提高1%,也可以大大节省大型公司的翻译服务。随着机器翻译质量的发展,越来越多的机器翻译将取代人工翻译市场并节省薪资成本。不必试图涵盖所有语言,您可以选择一种流行的对(英语-西班牙语)和一种领域(医学,冶金,石化等)。 100%的质量-在所有主题上都是完美的机器翻译-在不久的将来无法实现。随后的每个质量改进百分比将更加困难。

但是,这并不能阻止机器翻译市场在2023年之前占据整个市场的很大一部分(与DeepL相似,它无形中占据了Google市场的10%),因为大型公司每天都要测试各种翻译器API。而将其中一种语言的质量提高一定百分比(对于任何一种语言),将使他们节省数百万美元。
大公司创建自己的开放时间opensouce的策略已开始见效。行业中有更多的初创公司,科学论文和人员,这使我们能够撼动市场并获得更好的翻译质量,从而提高了我们对机器翻译市场的预测。

每年,都会举办NLP竞赛,公司,初创公司和大学将在竞赛中争夺在某些语言对中获得最佳翻译的人才。

http://statmt.org/wmt18/

通过分析获奖者名单,有信心小资源可以取得出色的成绩。

公司开业


几年来,该项目增长了许多倍。应用程序不仅出现在移动平台上,而且出现在计算机,可穿戴设备,即时通讯程序,浏览器,语音助手中。除了翻译文本外,还创建了语音,图片,文件,站点和电话的翻译。最初,我计划使我的翻译API仅用于我的应用程序。但是后来我决定将其提供给所有人。竞争对手继续前进,有必要跟上。

在那之前,我是作为一名个体企业家独自管理所有事务的,并雇用人员进行外包。但是产品的复杂性和任务数量开始迅速增长,并且很明显,您需要委派职能并迅速在办公室中雇用人员到您自己的团队中。我打电话给一个朋友,他辞掉工作,决定于2019

3月开设Lingvanex。在那一刻之前,我正在创建一个没有广告的项目,当我决定组建团队时,我遇到了搜索问题。没有人相信这是可以做到的,并且不明白为什么。我不得不采访很多人,每个人都聊了3个小时,讨论成千上万个显而易见的细节。当有关该项目的第一篇文章发表时,它变得更加容易。经常有人问我一个问题:

第一个问题总是听起来“您比Google更好吗?”

目前,我们的目标是在主要的欧洲和亚洲语言中实现通用主题的Google翻译质量,然后提供以下解决方案:

1)通过我们的API进行文本和网站的翻译比竞争对手便宜三倍,提供出色的支持服务并易于集成。例如,谷歌翻译的成本是每百万个字符20美元,对于大量的

2来说这是非常昂贵的。2)通过API对某些主题(医学,冶金,法律等)进行高质量主题文档翻译,包括集成到专业工具中翻译器(例如SDL Trados)

3)集成到企业的业务流程中,以根据我们的许可在其服务器上运行翻译模型。这使您可以保留数据的机密性,而不取决于翻译文本的数量,并针对特定公司的具体情况优化翻译。

对于特定的语言对或主题,您可以使翻译质量优于竞争对手。你什么都可以做。这是公司资源的问题。只要有足够的投资,就没有问题。做什么和怎么做-众所周知,您只需要工人和金钱。

实际上,随着识别,语音分析,机器翻译的改进,NLP市场正在迅速增长,并可以为小型团队带来丰厚的利润。所有的炒作将在2-3年内开始,届时大型公司今天的市场推广将硕果累累。一系列合并/收购将开始。此时此刻最主要的是要有一个可以出售给观众的优质产品。


一直以来,测试应用程序已带来超过100万美元的收入,其中大部分用于制作您自己的翻译器。现在很明显,所有事情都可以便宜得多,做得更好。犯了许多管理错误,但这是经验,因此没有人可以咨询。本文仅描述了这个故事的一小部分,有时可能不清楚为什么要做出某些决定。在评论中提出问题。

目前,我们还没有达到Google翻译的质量,但是如果团队中至少有一些自然语言处理专家,我认为这样做不会有任何问题。
现在,我们的翻译员可以最好地将英语翻译成德语,西班牙语和法语。

链接到已经开发了3年并投入资金的新程序。如果有人希望看到本文开头讨论的旧测试应用程序(赚钱并跳了3500万跳),请亲自撰写。

适用于iOS的翻译器


安卓翻译器


Mac OS转换器


Windows翻译器


Chrome翻译器


电报翻译器



可以找到此链接

翻译API演示



该团队还需要一个产品经理(移动应用程序)和一个具有NLP项目经验的Python程序员,

如果您对联合伙伴关系和提议有想法-请写一封个人电子邮件,并添加到Facebook,LinkedIn。

All Articles