安德鲁·安(Andrew Un)的著作《机器学习的激情》的翻译。第51章和第52章

以前的章节


51.选择管道的组成部分:轻松解决问题


除了提供培训数据外,构建管道时要考虑的第二个重要因素是组件的易用性。您需要尝试选择管道中的此类组件,每个组件都易于开发或学习。但这意味着什么:该组件易于学习?


图片


以下是按难度增加顺序的机器学习任务:


  1. 曝光过度图像的分类(如上例所示)
  2. 确定是在室内还是室外拍摄图像
  3. 确定图像是否包含猫
  4. 确定图像是否包含具有黑白毛的猫
  5. 确定图像是否包含暹罗猫(猫的特殊品种)。

它们每个都是一个二进制分类问题:输入图像,算法输出0或1。此外,列表中的任务越高,神经网络“越容易”学会解决它。简单的任务需要较少的培训示例。


目前尚无很好的机器学习任务难度的正式定义


: « », , — , , ( ). . .


, «», ( (shallow neural network)), «», (, () ). .


, , , .


图片


, . :


图片


, :
图片


( ) .


图片


( ) , 1, - .


图片


( ) , , 0 1.


: , , , . , , . , Deep Learning Coursera.


.


图片


: (1) , (2) (3) . «», , .


, , , , «» , .


52.


, x , . , ( , , )?


x = 图片


y = « , »


h: -> Y, y .


:


(X)(Y)
/ (0/1)
,
,

, , , y, , . , (x) (y).


XY
Mao et al., 2014
Suskever et al., 2014
(, )Bordes et al., 2015
Hannun et al., 2015
(TTS)van der Oord et al., 2016

深度学习的增长趋势是端到端系统的教学,其输出以及适当的带标签数据(系统带有标签的输入和输出)的可用性,您可以获得图像,文本片段,音频剪辑和其他复杂对象,而不仅仅是数字。


延续


All Articles