⛲️ 🆘 🐯 播客：国防领域的初学者正在等待什么 👂🏾 👃 👩🏻‍💻

如所承诺的，我们提供了Podcast的第一个版本的完整记录（您可以在Apple Podcasts中收听）。Andrei Filchenkov物理学和数学博士，信息技术与编程学院副教授，国际计算机科学实验室机器学习小组负责人与我们交谈。

^{照片由塞缪尔·伯克（Unsplash.com）}

梅德：去年你获得了伊利亚·塞加尔洛维奇奖，你说，你所从事的不同领域，除了没有机器学习任何共同的载体。请对此方法发表评论。这样的自由对您至关重要吗？

Andrey Filchenkov：当我来到ITMO大学工作时，在我们已经成为科学中心的计算机技术实验室里，没有任何与机器学习直接相关的东西。然后我们开始实验。那是2014年。

德米特里：您为自己制定了任务吗？

安德鲁：他们决定了。机器学习的设计方式使思想从一个领域流向另一个领域，而模型则从一个任务流向另一个领域。很难局限于某种东西。因此，不仅我们在工作。几乎总是，机器学习领域的研究人员并不严格地坐在一个小众市场，周围总是有很多研究。

另一件事是，最初我们没有向量可用于构建工作。但是，现在我们深入研究特定主题，并通常限制了我们工作的适当领域。首先，这是自动机器学习，它与图像处理和生成相关，包括视频，社交网络分析。

去年出现了两个相对较新的主题：用于代码分析的机器学习和用于路由的机器学习。自2016年以来，我们一直在进行路由，但深入探讨了这个主题。我们尝试执行各种任务，但是这种方法会影响结果。现在，我们正在尝试着重于质量而不是多样性。

德米特里（Dmitry）：因此，您已经在为在实验室工作的人员制定点问题，并为大量专家充当理论指导者？

安德鲁：是的。

德米特里：在外行看来，这项活动与非常基本的事物，公式和科学文章有关。但是正如您所看到的，来自实验室的人，与社交网络分析，推荐引擎，特朗普的Twitter分析一起工作。请告诉我们一些在实践上可以理解的项目？

安德烈：我们的活动可以分为两类。首先是适用于很多事物的算法。例如，特征选择算法。它们是许多任务所必需的-分析DNA序列，处理医学数据等。第二类是主题领域中的任务，我们已经在其中尝试使用不同的算法。此类别中的任务更多，它们是可以理解和多样的，并且并不总是完全科学的。

^{照片中：Andrey Filchenkov}

除了实验室外，我们还有一个共同的环境，创业公司和公司在此环境中发展。它们带有工业订单，因此产生的任务相当实用。最近，我们与TVC频道合作。他们有大量不同的文档和文章。他们对监视印刷机中这种现象的表现以及其随时间的变化非常感兴趣-印刷机中有多少传统的Ilon Mask，在何种情况下会遇到这种现象。我们为他们编写了一个搜索引擎，以便在相当大的数据库中快速执行相当复杂的查询。

德米特里：对于他们来说，联系您并进行定制开发要比向市场出售成品“盒装”产品更为有效？

安德鲁：是的。他们有一项特定的任务。市场上没有这样的解决方案。

我们还与Vk一起做了相当有趣的事情，我们的一位研究生在那里工作。像大多数这些公司一样，广告是该网站的主要收入来源之一。并且您需要了解向谁显示此广告，以便一切都有效。任务看起来像这样。有大量的广告客户。我们需要确保他们有表演，并且人们会相关。

有许多与医学有关的研究。例如，通过照片进行皮肤分析以识别重要的医学标记。有两个主题。一个与识别痣是否是痣有关，或者它是某种严重现象的信号。第二点是了解引起这些斑点或皮疹的原因（这些斑点可能是大量皮肤和性传播疾病的症状）。

德米特里：在这里您可以提高基本诊断的可用性吗？

安德鲁：是的。但是，即使症状因为在皮肤上而可见，但分类也不是那么简单。我们可以自动执行此任务，以便您可以将应用程序放在手机上，拍照并理解，但是有些可疑之处。我们在这里没有做出决定，但是如果应用程序告诉此人看来他有问题，最好去看医生并进行咨询。

各种解决方案的转让与莫斯科地区的发展

时间码（音频版本）-09:07

德米特里（Dmitry）：您是否遇到过以下情况：您在某个活动领域进行了测试，然后将其应用于另一领域（作为实验），或者遇到任务困难？

安德鲁：通常，我们尝试使用自动机器学习。粗略地说，我们有一些黑匣子，我们可以在其中放置任务并获得基本的解决方案。当然，它们通常比之后您所能做的要糟糕，但这是您可以关注的基准。如果我们谈论特定的解决方案，例如与图像处理有关的解决方案，则此处的传输有效。最基本的是预先训练的VGG及其对数据的进一步训练。基于训练有素的接入网形成基本解决方案是一个标准步骤。通常会发现，最好不要在当前配置中执行任何操作。

德米特里（Dmitry）：在这种情况下，是从铁的角度证明您正在更改某些体系结构的东西，还是仅涉及软件解决方案，算法？

安德鲁：通常我们只谈论算法。我们几乎不需要适应铁的问题。最亮的是我们与华为所做的识别照片中字符的操作。由于必须在电话上实现此模型，因此存在相当严格的限制。在内存不足的地方，可以使用的操作受到限制，因为不可能以纯形式应用我们在TensorFlow上所做的操作。在这里，我们不得不躲避，因为有好的决定，但是没有转移的可能性，我们必须努力。但是，我们通常会做出一个决定，使其迅速在服务器上的某个地方起作用，但不受其他所有限制。

德米特里：我问，因为经常会出现这样一个系统的效率可能取决于什么的问题。告诉我们您目前在该领域算法和理论方法的发展方面面临哪些问题？这个领域已经达到极限，还是现在正在迅速发展？

安德鲁：这个问题相当复杂，但很有趣。长期以来，一切都仅限于铁。有相当复杂的算法，但是它们并不总是能很好地工作。现在，神经网络已经连接了很多东西，因为已经出现了使它们能够驱动的计算能力。尽管从某种程度上讲，计算能力已变得不那么重要，但我们始终表示我们将承担一定的成本。如果我们谈论经典算法，那么容量就不会有任何特殊问题。问题是如何快速有效地找到最佳解决方案。

最初，由于能力有限，解决问题的人员必须了解算法的工作原理，资源要求以及该任务的适用性，这一点很重要。一段时间以来，由于容量变得可以承受，这种情况变得不那么理想了。

德米特里：也就是说，计算能力和功能的增长已经有了足够大的飞跃。我们从脉搏上轻轻地举起了一只手。现在您要归还它。

Andrei：是的，最近几年自动机器学习有所增加。有一个版本可以将计算机学习中的所有专业知识替换为计算能力上百倍的增长。自动机器学习实际上正在尝试寻找解决问题的方法。这是一个容量问题，因为这是一次搜索，而不是破产，但仍然非常复杂，漫长，大规模，需要大量的计算资源。结果，我们再次依靠这样的事实，即专业知识已被资源及其可用性所取代。

^{图片由Franki Chamaki（Unsplash.com）拍摄}

我不相信我们永远不会遇到不需要专家的情况，因为在我们提出功能强大的系统之前，仍然有许多这样的任务无法自动完成（设置任务，理解业务流程）人工智能。至少不会很快。因此，将保留任务，但是重新启动计算能力的要求成为关键因素之一。

德米特里：但是，与此同时，就算法本身的效率而言，您仍然必须采取一些措施来“赶上”计算能力的增长。具有强大能力的公司，但在我看来，每个任务仍然有一定的时间框架，必须解决该问题并保持相关性。

安德鲁：是的。有一个理想的质量，有一段时间必须达到它。我们双方都有局限。如果有足够的时间，那么几乎总是可以实现质量。当然，尽管每个任务对获得什么质量都有根本的限制。粗略地说，我们将无法通过卫星的位置来预测角色，而不是硬币。但是，如果所需的限制没有达到上限，那么我们可以在一段时间内达到所需的质量。有时我们可以说，在指定的时间内，我们找到了一个很好的解决方案，但这次我们没有获得最好的解决方案。总是有这两个“坐标”。

研究新结果，它们的理解和适应

时间码（音频版本）-16:41

德米特里：从实验室工作人员的专业发展角度来看，与在此过程中直接学习的内容相比，如何评估基础知识和理论培训的分布情况：分析该领域的科学文章，突破和变化？一个星期或一个月内会有多少这些变化？在您现在从事的项目中，在您的活动中实施它们有多困难？

安德鲁：这个问题问得好。一切都取决于面积。例如，一个正在自动执行群集任务的研究生现在正在保护我。通常，没有很多新的结果。另一方面，他使用AutoML进行群集。在这里要跟踪新结果并非易事。而且，很难局限于一个区域。

就像我在开始时所说的那样，在机器学习领域，一切紧密相连。最初在图像处理领域中出现的想法在其他几个步骤中流动。文字处理是最接近的候选者。最重要的成功因素之一就是，不仅要了解利基市场中发生的事情，而且还要了解机器学习领域中的情况。^{尼克·希里尔}^（^{Nick Hillier}^）

^{摄影（Unsplash.com）}

这很难做到，因为会产生很多结果。大型会议上有成千上万的参与者，大量的作品，每周多达数百部作品。这样的金额甚至难以翻阅。但是里程碑很重要。

为此，您不需要从头到尾扫描存档或阅读会议集，但是订阅与机器学习有关的公开信息并跟踪其中的内容非常重要。

最初，在语言处理中有许多不同的结果。 Word2vec出现后，每个人都开始转向嵌入。有很多。有几个基本的任务，但是对于不同的特定任务，它们都有自己的任务，有必要监视他们如何改进它们。然后Google推出了BERT，并带来了很大的增长。在某个时候，事实证明，如果您了解BERT的工作原理，并且参与了英语处理，那么您真的不需要任何东西。

您不必担心fastText新版本的成功以及基于它的嵌入。 BERT现在有很多更改。它仍然是基本的，就像一次使用Word2vec。但是已经有很多修改，每个月有几份工作，或者甚至每周少几份工作。

而且这种动态一直在变化。在某个地方，所有事物都崩溃了，在这里您可以追赶某些事物，然后它又开始以不同的颜色绽放，您需要遵循此规则。问题是这种情况发生的频率更高，也就是说，出现新结果的速度只是在增加。如何跟踪这一问题是我遇到的那些基本生活问题之一。

德米特里：这种活动的爆发是否更多地出现在创建自己的框架的大公司周围，还是科学界抛出了什么？

安德鲁：每个人都不同程度地参与其中。我必须承认，公司比大学有更多的成就。这取决于区域。典型的情况是大型科学家不仅在大学而且在公司工作。他们通常会雇用那些继续从事研究活动的人员。因此，公司积累了巨大的智力潜力。大学很少能够提供类似的计算能力和数据集，因此越来越多地发现公司对文章（隶属关系）的依赖。

德米特里：即使在文章上，尽管该公司有能力从公众那里关闭大部分开发和研究的能力？这很有道理。但是大学没有这样的机会，从本质上说，它有义务出版一些东西。

安德鲁：确实，可能存在偏见。无论如何，大学都会出版，因为这是他们工作的特殊性。来自大学的文章流更大，因为有许多大学，人们被出版，而且公司也不是到处都欢迎。但是突破性的结果-公司拥有更多的成果。

因此，他们利用自己的名声和能力，吸引新的科学家，并解释说可以用它们完成研究，而且非常酷。例如，他们制作了一个新模型，可能非常理论化。但首先，这通常在公司中具有重大的现实意义。可以将它们布置为开放源代码，但是例如，像Google一样，它已经是某些以前的版本，他们自己认为这些版本已过时。

开放开发，准备出版物和要求

时间码（音频版本）-23:48

德米特里：开源开发在您的企业中有多重要？它们如何影响她？在具有集群自动化功能的示例中，您说过要进行开源开发，并在一些基本的基础上应用它，以便可以进行深入研究，研究，即朝相反的方向发展，并且不会在狭窄的领域中陷入快速的变化。

安德鲁：发布的代码非常重要。几乎总是出现标准问题-所做的工作是否起作用。仍然-与结果比较的问题。当一个人创造出某种东西时，他需要证明它比以前更好。不幸的是，根据文章中发布的数字，人们将自己与之前的事物进行比较时经常会出现这种情况。这不是很正确。不能保证一个人以他人的方式进行实验。因此，重要的是要做出不同的决定，然后自己运行它们，检查它们如何工作，并确保在类似的实验设置中做得更好。

只有拥有代码，您才能正确比较。

^{照片班次（Unsplash.com）}

其次，如果一个人从竞争的角度看并没有开发出任何新东西，而是想要应用该方法，那么最好将它安装在GitHub上，并且可以使用它。但是，即使布置了某些内容，文档也不总是可用。很少发布带有良好文档的工作。碰巧他们根本没有上传代码，因此您必须按照本文所述实施所有操作。这是问题。这种情况在机器学习结果的可再现性方面造成了困难。这几乎是我们领域中的主要问题。

发布再培训结果很容易，但是很难检查是否没有代码。我们将自己的AutoML与现有解决方案进行了比较。幸运的是，已经有一些积极使用的已发布库。还有更多新的解决方案，但是没有列出它们的代码。显然，他们的情况更糟-他们提出的是我们决定的特殊情况。

德米特里：是否有可能构想出一些至少可以在您的工作框架内消除此问题并保证再现结果的可能性的方法？

安德鲁：您可以链接到打开的存储库并提供文档。我试图在所有文章中做到这一点。不幸的是，并非总是如此。几乎每个人都会发生这种情况：一个人编写了一个代码，它可以工作，但是人们为与他人共享它感到尴尬，因为他们为其中的某些元素感到羞耻。但是我尝试传播这种想法，即在撰写文章时，您需要使用指向GitHub的链接对其进行补充。带有代码的存储库必须事先准备好。

德米特里（Dmitry）：在这里您需要花一些时间在文档上。

安德鲁：至少是最小的。这是必要的，这样即使在根本没有记录代码的情况下，本文中写的内容也有助于理解正在发生的事情。虽然很难。项目越大，文章帮助越少。

实验室专家的工作和产出频率

时间码（音频版本）-28:37

德米特里：如果您评估准备科学文章和实际项目的时间，那么一个人可以在什么时间范围内实现您所从事领域的某些事情？按照惯例，他每六个月或一年发表一次文章，而某个大型项目则需要两年。

Andrei：存在一个严重的问题，那就是它很大程度上取决于假设本身。确实很难回答这个问题。我可以对项目进行粉刷，以便在两个月和两年内完成。在这种情况下，将获得类似的结果。

这并不意味着您可以花这两个月的时间每天减少十二次。这里有九位母亲。我们与计算能力息息相关，但是许多事情可以并行化。根据项目内容，可以完成许多事情。

与编写文章类似。在某些情况下，模型学习一个小时，在某些情况下，模型学习一天。在AutoML中，实验可能需要一周的时间。碰巧的是，实验没有执行合理的任务，因为它们没有计算在内。因此，在许多任务中，需要考虑某个CIFAR上的所有内容。至少有一些合理的数据集，更像是实践，没有人要尝试，因为该文章将在两年内发布，该模型将发布，但已经过时了。

影响事务状态的第二个条件是您对主题领域的了解。如果您了解存在哪些模型，则可以进行实验，测试特定的假设，然后一切都很好。但是通常任务可以在过程中更改。不会太多^高清

^{摄影科学（Unsplash.com）}

但现在它在某些方向上已经发生了一些变化，有必要证明您提出的建议的新颖性。我们必须看看之前做过的事情，进行比较。

事实证明，您的决定是新的，但不是最酷的决定。您正在尝试改进它，结果正在改变。有必要证明结果是新的。还有，一个人在某处进行了强化训练，现在我们必须朝这个方向看。

这个过程可能非常艰辛。有长期的文章，他们写了很长的时间，因为事情变化不大。另一个要点是计划文章发布的平台。在好地方，他们需要证明为什么您的结果很好。碰巧这种解释是最耗时的。也就是说，该模型有效，并且了解其工作原理是一项单独的任务，甚至比提出此模型还要复杂。

最后，文章本身的写作。不幸的是，所有对科学做出贡献的值得发表的地方都是英语。这施加了其局限性。撰写英文文章并非易事。如果实验室员工写了他的第一篇文章，他会做很长一段时间。如果这是他的第二十篇文章，请快速。而且，如果我不积极踢一个人，他会写几个月，如果我愿意，他会写几个星期。当然，这取决于他所考虑的主题的复杂程度。

发展领域的选择和前提条件

时间码（音频版本）-33:04

德米特里：方向的最初选择如何影响发展？例如，一个人刚刚开始认真地做所有这些事情，例如，占据了自己一个很大的区域。随着周期性变化和相关行业成果的增长，拐杖开始攀升，一个人像沼泽一样陷入其中。如何专注于初期阶段？

安德鲁：如果一个人想象出可以使用的各种技术，就会出现这样的故事。如果他刚刚开始，很可能不会出现此类问题。

德米特里（Dmitry）：因为我们所讨论的原始基础借鉴了现有的结果，而一个人却没有带来什么新的东西？

安德鲁：是的，你可以这么说。良好的阅读在这里很重要。阅读的文章越多，编写起来就越容易。文章的语言是一种单独的语言。这是科学英语。此外，机器学习中的科学英语不同于生物学中的科学英语。如果一个人阅读了很多文章，那么他就更容易提出思想和整理文章。

德米特里：告诉我们您希望在新移民中看到的功能-那些刚刚准备加入您的人。

安德鲁：首先，这是编程的能力。该字段被应用，没有任何地方。如果我们在一个完全基础的领域中进行研究，我们将无法考虑-数学训练就足够了。但是我们所做的只是假设它将例如在Python中实现。编程技巧至关重要。

^{通过照片亚太区首席技术官Matt乔杜里（Unsplash.com）}

第二是机器学习领域的核心竞争力。重要的是，即使一个人从事狭窄的工作，也要理解什么是机器学习，如何安排机器学习。例如，他开始使用增援进行培训，但是在这里您仍然需要了解机器学习的总体结构，再培训是什么。知道存在哪些模型和想法以尝试在家中应用它们也很重要。一个更重要的因素是动力，潜水的愿望和内部兴趣。如果一个人具有良好的头脑，对领域的理解，自己的想法的出现，那么他将能够更好地撰写文章并将自己定位在我们的领域。

德米特里：除了管理实验室和参与病房的工作之外，您还能做什么？您必须以一种或另一种方式来研究，理解，提出解决方案，纠正错误。您有任何个人第三方项目吗？也许您的日子看起来有些特别？还是所有的努力都只用于个人资料活动，这是您的爱好吗？

安德烈：我的每一天都不一样。例如，11月我去圣彼得堡的可能性比去圣彼得堡要小。不能说我一次或两次都有一些固定的常规活动。我正试图写出我想在一个月内要做的事情。例如，要阅读这么多文章，与您的研究生聊天，分散任务，这取决于我在哪里，我在做什么，什么因素影响它。

从孩提时代起，我就想做科学，我一直都致力于研究科学。没错，实验室的管理不是一门科学。组织活动和科学活动是两个不同的事物。通常，科学家对组织和官僚制度并不特别感兴趣。如果一个人设法管理得好，那么他就没有时间沉浸在任务中。不幸的是，我无法有效地将其结合起来：要么我开始钻研领导层并脱离上下文，要么我开始研究，而组织过程即将开始。因此，现在我正在尝试重新考虑该方法。我们的实验室有一位经理Ivan Smetannikov，我们有行政人员，但人员仍然不足。

领导是一个复杂而压力很大的过程，需要很多时间。为了从事科学活动并解决多个具体问题，这是必不可少的。我可能是一名高级研究员，处理一项或多项任务，但是通过这种方式，您可以处理大量主题，而且总是更有趣-潜水，卸载并提出解决方案。对于我来说，提出一个解决方案比实施和验证它更有趣。其他人可以这样做，但这并不是例行公事。

在研究中，您几乎永远不会说：“这样做！”相反，他们说：“尝试这样做并考虑一下。”您可以为一个人设定方向，提供线索，他绝对没有日常工作。如果您说：“尝试解决此问题”，那么有人会成功，但有人不会。始终不清楚从哪里开始和在哪里看。我刚刚指挥的某个地方，我设定了一个任务的地方，我几乎要推出解决方案的地方。

德米特里（Dmitry）：您会选择那些将参与各个领域的人吗？

安德烈（Andrei）：我们与每个人讨论他想做什么以及他的研究将会做什么。

德米特里：这样的个人做法？

安德鲁：当然。机器学习中的许多研究都是非常个别的事情。显然，人们可以分组协作并一起做某事，但是强迫一个人做某事是一种无效的方法。碰巧他没有任何偏好，可以邀请他做某事。他可以参与其中。但是如果一个人没有被吸引，他就没有内在动力，他不会读书，他也不会发展。他将是一个出色的表演者，但这还不足以进行出色的研究。需要个人利益。因此，有必要为一个人选择一项研究。

德米特里：对于那些希望从广义的编程转向机器学习这一主题的人，您推荐哪些资源或文献？

安德鲁：主要推荐- 课程在安德鲁·恩（Andrew Ng）的Coursera上。高等经济学院有更深层次的课程。进行练习很重要。机器学习是关于算法如何真正与数据一起工作的。这与数学相差甚远，因为数据会影响您需要处理的内容。您在学习时会感觉到这一点，代码中有很多陷阱和细节。我可以推荐以下书籍：Sergei Nikolenko的《深度学习》，更经典的Hesti，Tibshirani，Friedman或完全经典的Bishop。当然，这有点过时了，但是您可以提出一个好主意。

播客做饭和销售线索德米特里·卡巴诺夫。

补充阅读：

ITMO大学的初创公司（我们在哈布雷的英语材料）：

播客：国防领域的初学者正在等待什么

各种解决方案的转让与莫斯科地区的发展

研究新结果，它们的理解和适应

开放开发，准备出版物和要求

实验室专家的工作和产出频率

发展领域的选择和前提条件

More articles: