Traducción del libro de Andrew Un, Pasión por el aprendizaje automático, capítulos 53 y 54

Capítulos anteriores


Análisis de error parcial.


53. Análisis de errores en partes


Deje que el sistema sea un transportador compuesto que consta de módulos con aprendizaje automático. ¿Qué componente de este sistema debería mejorarse primero? Al correlacionar los errores del sistema con elementos específicos del transportador, se puede tomar la decisión de priorizar el trabajo.


Volvamos a nuestro ejemplo de clasificador de gatos siameses:



El primer elemento del sistema: un detector de gatos, detecta y corta un fragmento con un gato de la imagen. El segundo elemento, el identificador de la raza, decide si el gato siamés en el fragmento o no. Puede pasar años trabajando para mejorar cualquiera de estos dos componentes. ¿Cómo decidir en cuál enfocarse?


El uso del análisis de errores en partes implica que para cada error estamos tratando de determinar el resultado de la operación de qué módulo (o, a veces, varios) del sistema compuesto es. Por ejemplo, el sistema determina incorrectamente que no hay un gato siamés en la imagen (y = 0), a pesar de que está representado en él y la etiqueta correcta es y = 1.


¡imagen!


Analicemos manualmente los resultados de cada módulo del sistema. Supongamos que un detector de gatos detecta un gato de la siguiente manera:


imagen


, :


imagen


, . y = 0. , , y = 0. , . , , :


imagen


, « ». , 100 , 90 , 10 « ». « ».


, . , . , , .


54. «»


:


imagen


:


imagen


« » , , , y = 0 ( ).


imagen


, « » , , , , , . , , « », « ».


, . , , , :


1. , ,



2. « » . « » , «». , «».


, , « » «» .


:


  • 1: «» , « » - y = 0. , , .
  • Caso 2: en un fragmento perfectamente cortado, el "clasificador de raza" devuelve correctamente y = 1. Por lo tanto, si el detector de gato produce un fragmento mejor, la conclusión general del sistema sería correcta. En este caso, atribuimos el error al "detector de gatos".

Al analizar ejemplos clasificados incorrectamente de muestras de validación, podemos atribuir inequívocamente cada error a uno u otro componente del sistema. Este enfoque nos permite estimar la proporción de errores por cada elemento del sistema y, por lo tanto, decidir en cuál concentrarnos.


continuación


All Articles