安德鲁·安(Andrew Un)的著作《机器学习的激情》第47和48章的翻译

前几章


端到端深度学习


47.引入端到端学习


假设您要创建一个系统,该系统可以分析Internet上的产品评论并自动评估该评论者是否喜欢该产品。例如,评论“这是一个伟大的拖把!” 必须被这样的系统认为是非常积极的。“这种低质量的拖把-我白白买了”的评论则极为消极。


识别正面和负面意见的任务称为“情感分类”。
这样的系统可能看起来像是由两个组件组成的“输送机”:


  1. 解析器(parser):一种使用描述重要单词的信息来注释文本的系统。例如,您可以使用分析器来表示所有形容词和名词。结果是带注释的文本:
    “这是一个很棒的形容词拖把名词!”
  2. 态度分类器:一种经过训练的算法,可以将带注释的文本作为输入并预测其情感色彩。解析器的注释极大地促进了算法的学习:例如,通过将更多的权重附加到形容词上,该算法迅速调整为有意义的单词,例如“ great”,并忽略了没有含义的单词,例如单词“ this”。

作者的注释:解析器提供了更丰富的文本注释,但是这种简化的描述足以解释深度学习。


您可以按以下方式描述生成的两部分“传送带”:


图片


«» . (​end-to-end learning algorithm​) , « !» , :
图片


(end-to-end learning systems) . «» , , , . «» «».


, . . , , , .


48.


. :
图片
:


  1. : , MFCC (- ), , , , .
    : , - , ,
  2. . , «». , «k» «keep» — , «c» «cake». .
  3. : .

:


图片


«» , . «» .
, :


图片


«» : , ; ; , .


«» . , « » . .
, «», :
图片


, (end-to-end learning) , . , , . .



All Articles