机器学习文章精选:案例研究,指南和2020年1月的研究

机器学习领域的研究工作正逐渐离开大学实验室,并从科学学科开始应用。但是,仍然很难找到用普通语言撰写且没有十亿个脚注的相关文章。

这篇文章包含一月份的英语材料清单,这些材料的撰写没有过多的学术性。在它们中,您将找到代码示例以及到非空存储库的链接提到的技术属于公共领域,不需要重型铁进行测试。

文章分为四种类型:开源工具的公告,在商业开发中使用机器学习的案例,机器学习研究以及使用PyTorch和TensorFlow的实用指南。



机器学习开源技术的公告


LaserTagger

本文简要讨论了LaserTagger的功能和体系结构;一种允许您以各种方式生成文本的工具-组合和拆分句子,以及用其他语言复述它们。与seq2seq-models不同,它重新使用单词,从而确保了高速文本生成。

重整器

处理串行数据(文本,音乐或视频)需要大量的内存资源,因为此数据取决于周围的环境。与Transformer(一种流行的神经网络架构模型)不同,Reformer占用上下文的内存要少得多-只有16GB。这足以处理大型文本数据集-例如,Reformer能够处理文本“犯罪和处罚”。您也可以使用该工具“完成”丢失的图像片段。

Wav2letter @随处可见

大多数实时语音识别框架都使用递归神经网络,而Wav2letter @随处可见使用卷积声学模型。该框架是用C ++编写的,可以轻松地集成到其他编程语言中。创建者设法将吞吐量提高了三倍,并在功能不十分强大的处理器上提供了计算效率。本文提供了基准和模型链接,这些模型将有助于重复学习成果。

Polygames一个

框架,可教人工智能玩策略游戏,甚至完全不熟悉的策略游戏。与其他类似技术不同,此模型无法从大量成功的游戏管理示例中学习,因此,它不需要数据集。

HiPlot

工具可视化研究数据。使您可以评估超参数的有效性,例如学习速度,正则化和体系结构。本文提供了python代码段及其可视化示例。木星笔记本电脑支持HiPlot。

机器学习指南



TensorFlow.js

开源库允许您运行机器学习模型而无需离开JS生态系统。它适用于所有当前的浏览器,Node.js的服务器端以及React Native的移动平台。

创建自定义的TFX组件

任何人都可以使用TFX平台创建现成的机器学习管道。该平台提供了大量的标准组件,但有时不适合使用。本文讨论了如何创建用于TensorFlow的完全自定义管道。

使用PyTorch加速NVIDIA Dali

本文讨论了一些方法来优化DALI的使用,并创建一个仅使用CPU(不带GPU)的过程,并将PyTorch上的机器学习过程加快4倍。

机器学习中快速实验的数据和模型的版本控制

本文介绍如何为可重现的机器学习过程创建和使用版本化数据集。例如,使用Git,Docker和Quilt,使用Detectron2创建了一个深层神经网络来进行对象识别,这是一个基于PyTorch的系统,使用算法进行对象识别。

PyTorch的主动转移培训

当为一个特定任务创建的机器学习模型适应另一任务时,转移训练就是一个过程。通常,足以重新训练现有模型中的最后几层。优点是,这需要人类对数据进行最少的标记。本文提供了将迁移学习应用于主动学习的指南,该学习旨在识别需要被人们标记的数据模式。

商业发展案例


使用TensorFlow创建智能音乐库

中国领先的音乐流媒体平台的开发人员分享了使用该框架的经验。他们详细说明了使用了哪些乐器,如何训练模型以确定音乐的类型和风格以供后续推荐。例如,将声音与音乐分开,以使用文本识别输出歌曲的歌词。由于平台上的某些内容是由用户录制的,而没有使用特殊的录音设备,因此作者学会了消除干扰和背景噪音。

用机器学习训练狗

知道球队的听话狗更可能找到新主人并离开庇护所。但是,并非所有的庇护所都有训练犬的能力。该项目的目标是训练汽车,以了解狗是否完成了“坐下”命令,狗吠或发牢骚等。

训练吸尘器一家

中国智能吸尘器制造商已经对设备进行了训练,以识别散落在地板上的袜子和电线。凯斯(Case)谈到从照片创建独特的数据集以及使用各种机器学习算法的困难。

使用Raspberry Pi上的TensorFlow Lite创建智能相机

相机可以检测人脸的笑容并自动拍照。可以通过语音命令控制她。为了进行开发,我们选择了具有1 GB RAM和32位操作系统的Raspberry Pi 3B +。TensorFlow Light已将自身确立为移动和物联网设备的框架。本文演示了用于微笑和语音命令的识别系统的算法。

研究


用于求解数学方程式的神经网络

Facebook开发了第一个使用符号逻辑来求解第一类和第二类积分方程和微分方程的神经网络。过去,机器学习不适合此类任务,因为数学需要绝对精度,而不是近似值。该研究的作者使用了神经机器翻译。方程被机器视为文本句子,解决方案被视为翻译。为此,有必要从1亿对对方程及其解法中编译语法并准备一组训练数据。因此,研究表明神经网络不仅可以用来区分模式。

AI栖息地:超精确导航

Facebook 空间中的AI开发了一种大规模的DD-PPO强化学习算法,该算法使用RGB-D摄像头,GPS和指南针提供的数据有效地应对住宅和办公场所中的导航。经过DD-PPO培训的机器人可以达到99.9%的准确度。这篇文章包含令人印象深刻的视频。

您可以相信模型的不确定性吗?

发布的代码研究结果,当训练模型的数据与测试样本不一致时,它着重于协变移位问题。作者对最先进的模型进行了广泛的比较分析,为他们提供了来自文本,图片,在线广告和基因组学的数据集。目的是确定流行方法的准确性。在基准测试中,集成方法被证明是最可靠的。

感谢您的关注!

在您试用版之前,欢迎任何建议。

Source: https://habr.com/ru/post/undefined/


All Articles