Traducción del libro de Andrew Un, Passion for Machine Learning. Capítulos 51 y 52

capítulos anteriores


51. Elección de los componentes de la tubería: facilidad para resolver problemas


El segundo factor importante a considerar al construir una tubería, además de la disponibilidad de datos de capacitación, es la facilidad de uso del componente. Debe intentar elegir dichos componentes de la tubería, cada uno de los cuales es fácil de desarrollar o aprender. Pero, ¿qué significa: el componente es fácil de aprender?


imagen


Las siguientes son tareas de aprendizaje automático en orden creciente de dificultad:


  1. Clasificación de imágenes sobreexpuestas (como en el ejemplo anterior)
  2. Determinar si una imagen se toma en interiores o exteriores
  3. Determinar si una imagen contiene un gato o no
  4. Determinar si una imagen contiene un gato con pelaje blanco y negro
  5. Determinar si una imagen contiene un gato siamés (una raza especial de gato).

Cada uno de ellos es una tarea de clasificación binaria: se ingresa una imagen, el algoritmo genera 0 o 1. Además, cuanto mayor sea la tarea en la lista, más "fácil" será la red neuronal para aprender cómo resolverla. Las tareas más simples requieren menos ejemplos de capacitación.


Actualmente no existe una buena definición formal de la dificultad de la tarea en el aprendizaje automático


: « », , — , , ( ). . .


, «», ( (shallow neural network)), «», (, () ). .


, , , .


imagen


, . :


imagen


, :
imagen


( ) .


imagen


( ) , 1, - .


imagen


( ) , , 0 1.


: , , , . , , . , Deep Learning Coursera.


.


imagen


: (1) , (2) (3) . «», , .


, , , , «» , .


52.


, x , . , ( , , )?


x = imagen


y = « , »


h: -> Y, y .


:


(X)(Y)
/ (0/1)
,
,

, , , y, , . , (x) (y).


XY
Mao et al., 2014
Suskever et al., 2014
(, )Bordes et al., 2015
Hannun et al., 2015
(TTS)van der Oord et al., 2016

La tendencia creciente del aprendizaje profundo es la enseñanza de sistemas de extremo a extremo, cuya salida, con la disponibilidad de datos etiquetados adecuados (entrada y salida etiquetadas para el sistema), puede obtener imágenes, fragmentos de texto, clips de audio y otros objetos complejos, y no solo números.


continuación


All Articles