Traduction du livre d'Andrew Un, Passion for Machine Learning, Chapitres 53 et 54

Chapitres précédents


Analyse d'erreur partielle


53. Analyse des erreurs dans les pièces


Que le système soit un convoyeur composite composé de modules avec apprentissage automatique. Quel composant de ce système devrait être amélioré en premier? En corrélant les erreurs du système avec des éléments spécifiques du convoyeur, une décision peut être prise sur la priorité des travaux.


Revenons à notre exemple de classificateur de chats siamois:



Le premier élément du système - un détecteur de chat, détecte et découpe un fragment avec un chat de l'image. Le deuxième élément - l'identifiant de la race, décide si le chat siamois sur le fragment ou non. Vous pouvez passer des années à travailler pour améliorer l'un de ces deux composants. Comment décider sur lequel se concentrer?


L'utilisation de l'analyse d'erreur dans les parties implique que pour chaque erreur, nous essayons de déterminer le résultat du fonctionnement de quel module (ou parfois plusieurs) du système composite il s'agit. Par exemple, le système détermine à tort qu'il n'y a pas de chat siamois dans l'image (y = 0), malgré le fait qu'il y soit représenté et que l'étiquette correcte soit y = 1.


image!


Analysons manuellement les résultats de chaque module du système. Supposons qu'un détecteur de chat détecte un chat comme suit:


image


, :


image


, . y = 0. , , y = 0. , . , , :


image


, « ». , 100 , 90 , 10 « ». « ».


, . , . , , .


54. «»


:


image


:


image


« » , , , y = 0 ( ).


image


, « » , , , , , . , , « », « ».


, . , , , :


1. , ,



2. « » . « » , «». , «».


, , « » «» .


:


  • 1: «» , « » - y = 0. , , .
  • Cas 2: sur un fragment parfaitement coupé, le «classificateur de race» renvoie correctement y = 1. Ainsi, si le détecteur de chat produisait un meilleur fragment, la conclusion générale du système serait correcte. Dans ce cas, nous attribuons l'erreur au «détecteur de chat».

En analysant ainsi des exemples mal classés d'échantillons de validation, nous pouvons attribuer sans ambiguïté chaque erreur à l'un ou l'autre composant du système. Cette approche nous permet d'estimer la proportion d'erreurs pour chaque élément du système et, par conséquent, de décider sur lequel se concentrer.


continuation


All Articles