机器学习文章精选:2020年5月的案例,指南和研究


我们将继续以无障碍语言为您收集机器学习领域中最有趣的新闻和工具。

Jukebox

本月初,OpenAI通过发布其名为Jukebox的项目源代码引起了ML社区的极大兴趣。该工具使用机器学习算法,可以生成流行艺术家的作品。在网络上,您已经可以找到用户生成的曲目的示例,其中有非常不同的组合。

AR复制粘贴

法国开发人员Cyril Diagne引入了一个AR应用程序,该应用程序可以拍摄对象的图片,从图片中删除所有不必要的背景,并且(使用U ^ 2-Net)将结果传输到计算机上运行的程序。例如,作者展示了如何使用该应用程序快速选择插图并将其添加到演示文稿中。您已经可以看到代码并注册以早期访问该应用程序,该应用程序正在开发中。



姿势动画器

Pose Animator)一个用于Web动画的开源工具,您可以使用它对SVG中绘制的字符进行动画处理。该工具基于另外两个库FacemeshPoseNet,它们使用网络摄像头捕获动作。本文介绍了该工具的创建方式,并演示了如何使用它。



银河动物园

关于如何成功地将众包和机器学习成功结合以快速处理复杂信息的案例研究。 Galaxy Zoo平台结合了这两种方法,通过对数百万张图像进行分类来研究星系的演化。该材料描述了如何仅标记最能帮助改进现有模型的数据。

DistilBERT

初创公司Hugging Face分享了创建公共API的经验,您可以使用该API来优化Node.js上NLP模型的性能。

临床试验分析器

大多数临床试验未能招募足够的参与者。这是因为人们没有蜂蜜。教育并不总是了解选择标准和研究细节。 Facebook介绍旨在解决此问题的开源工具

GrokNet

Facebook已经宣布了一种专为电子商务设计通用计算机视觉系统。她能够识别从汽车到家庭装饰的不同类别商品的属性。本文介绍了如何在七个数据集上训练模型以及遇到的困难。一系列视频还显示了该模型如何帮助平台改变在线交易。

S2IGAN

似乎我们承诺不会在集合中包含包含指向空存储库链接的资料,但我想作一个例外。 S2IGAN是将语音转换为图像的框架。使用双编码器,已经创建了一个模型,该模型使用语音描述生成图像。该研究的作者承诺会尽快发布该代码,但是目前,他们必须对生成的鸟类的示例感到满意。



一致的视频深度估计

提出了一种算法,该算法使用卷积神经网络确定单个帧的深度,并为整个视频恢复几何上一致的深度。例如,当图像由于晃动而不稳定时,这有助于解决许多限制。您可以将类似技术应用于AR效果或自动驾驶汽车的各个领域。存储库仍然是空的,但是作者承诺共享源代码。

就这样,谢谢收看!

All Articles