🦍 🚣🏾 👩‍❤️‍👨 机器学习文章精选：2020年2月的案例，指南和研究 👨🏾‍🚀 👋🏿 👨🏿‍⚕️

继1月发布后，请参阅第二期摘要。在这里，您可以找到2月份英语材料的列表，这些材料的编写没有过度的学术性。这些出版物包含代码示例以及指向非空存储库的链接。提到的技术属于公共领域，其中许多不需要重型铁进行测试。

文章分为四种类型：
开源工具和数据集的公告
PyTorch和TensorFlow实用指南
机器学习 ML研究的案例
研究

开源工具的公告

ClearGrasp

算法旨在解决识别不均匀反射和折射光的透明物体的问题。任何标准的RGB-D相机都适合工作。

PyTorch3D

Facebook宣布了针对PyTorch的高度模块化和优化的库，该库简化了三维图像中模型的深度训练。

Hydra PyTorch生态系统的

新框架，旨在解决与项目复杂性相关的问题。通过命令行和配置文件提供项目管理功能。

TensorFlow.js用于React Native

该工具不使用Webview进行渲染，也不依赖浏览器中使用的Web平台的API。因此，这是一个具有适合该环境的后端的新集成平台。

矩阵压缩运算

符运算符允许您使用定义为分解的任何矩阵压缩函数，并创建张量流API以在训练任何张量流变量期间动态应用此压缩。

Torchmeta元学习

库为不同的数据集提供了一个单一接口，以简化新算法的创建。

自动翻转

通常，您想将屏幕方向从水平（16：9或4：3）更改为垂直。最后，框架出现了，这有助于以最小的损失动态裁剪帧。该工具确定框架和移动对象的边界，仅在屏幕上保留最重要的边界。

约束优化库

TensorFlow的工具，当考虑到许多其他参数（例如，发放银行贷款时）时，使用该工具，您可以在解决实际问题时降低不诚实结果的程度。该工具通过算法将数据采样约束转换为两个玩家的零和游戏。使用双曲几何工具的

Poincare贴图

揭示了各个单元格的成对相似性的层次关系。这允许使用机器学习来映射和分析生物细胞的发育。

PyTorch闪电+火炬手

高层次的抽象的创建者火炬手已经联手的日益普及PyTorch闪电和现在正在研究自己的球队。抽象使开发自动化，使代码标准化，可维护和可扩展。因此，研究人员可以将更多精力放在科学上，而不是使用代码库。

打开图像v6

发布了“开放图像”数据集的第六版，其中显着扩展了图像标记和注释的类型。照片的捕捉是如此详尽，以至于它们也将影响跨学科研究的进一步发展，在该学科中，计算机视觉与自然语言处理相结合。

CCMatrix：用于训练翻译模型的

数据集该数据集包含576种语言对中的45亿个位文本句子，将有助于创建更高级的NMT模型。

导游

使用TFX的分布式主成分方法

TensorFlow Transform如何允许您使用计算集群的资源以及如何启用TFX管道中的转换以可伸缩的形式应用主成分方法。

使用Keras中的TensorNetwork加速神经网络，

有关如何在机器学习的上下文中使用TensorNetwork库处理张量网络的资料。

TensorFlow Lattice：灵活，受控和解释性的机器学习图书馆用于教授有限和解释的格子模型

的功能的介绍性概述。

案例

购买TensorFlow.js的AR蒙版 Loreal初创公司ModiFace分享了在AR蒙版上下文中使用机器学习的经验。一个美容品牌的示例说明了如何将机器学习应用于电子商务。

实时车牌识别一个

循序渐进的案例证明，机器学习现在对每个人都可用。作者讲述了如何在家里组装预算设备，如何创建模型，对其进行培训，将其放置在AWS上以及如何开发客户端。

使用电话确定空气污染

创建一个应用程序的案例，该应用程序根据手机相机的照片确定空气污染程度。需要解决的问题是将来自不同用户的数据众包以进一步训练模型，但同时要确保用户数据的安全性。

在二维图像中添加体积效果

Facebook分享了开发卷积神经网络
程序的经验，该程序可为二维图像创建三维图像效果。在创建时，有必要解决很多问题，包括训练模型和优化系统以支持移动电话。

随着用户的快速增长如何走下去

Dungeon AI的创建者如何扩展以支持100万用户，并且通过Cortex，他们基于机器学习模型提供了微服务。

研究

使用“放射性数据”

通过“放射性数据”方法，您可以确定已使用特定数据集训练了机器学习模型。这可以帮助研究人员和工程师跟踪使用哪个数据集训练模型，以便他们可以更好地了解不同的数据集如何影响不同的神经网络的性能。

TyDi质量检查：不同语言的问题和答案的数据集

谷歌已经发布了一项研究和数据集，其中包含来自11种语言的200,000个问题和答案对，代表了广泛的语言现象。研究参与者被要求根据课文提出一个相关的问题，对此问题的答案未包含在课文中，此后建议在维基百科文章中找到该问题的答案。然后这些数据编译出一个数据集。

人工创建用于临床试验的数据集

由于各种限制，创建带有皮肤病变照片的数据集非常困难。现在有一个工具可以生成必要的数据以进行进一步的培训。 DermGAN将真实图像和具有真实图像主要特征（皮肤类型，皮肤状况，赘生物的位置）的相应预生成语义图作为输入，从中生成具有所需特征的新合成示例。

加速MRI扫描

该项目的目标是使用AI将患者的MRI扫描速度提高10倍。快照是使用DNN从原始数据生成的，并且在此过程中经常出现伪像。该研究表明恶意机器学习如何帮助减少了机器学习的数量。

基于DNN的推荐的基础结构优化该

研究分析了各种基础结构，这些基础结构用于使用DNN发布产品，视频等的个性化推荐。还提供了工具来验证基于DNN的生产规模建议的工作效果。例如，对数据中心（Broadwell，Haswell，Skylake）中使用的Intel服务器进行了基准测试。

Txt2π

对新的强化学习方法的回顾。它旨在帮助解决困难的任务，在该任务中，代理需要根据目标和环境知识（可能会发生变化）采取若干步骤。模型必须学会玩游戏，您需要根据某些规则打败怪物（阅读与怪物战斗）。

在超高分辨率图像上进行CNN训练

现有的数据和模型并行性允许对具有数十亿个参数的神经网络进行训练，但是对由高分辨率图像（例如CT图像）组成的数据进行训练仍然是一个问题。在本文中，我们考虑了卷积神经网络在超高分辨率图像中的适用性（存在一个项目代码）。

街景地图定向越野训练

Google从准备好帮助创建数据集的研究人员那里收集应用程序，以便对空间定向神经网络进行后续训练。

T5：迁移学习的新工具

作为一项大规模调查的结果，研究人员确定了最佳的迁移学习技术，并运用这些思想创建了预训练的T5模型以及对其进行训练的数据集。

在三月份的评选中，期望获得有关在对抗COVID-19中使用ML的文章：通过红外辐射实时确定人们的体温，诊断病毒，跟踪流行病的爆发等等。同时，仅此而已。感谢您的关注！

机器学习文章精选：2020年2月的案例，指南和研究

开源工具的公告

导游

案例

研究

More articles: