Übersetzung von Andrew Un's Buch, Leidenschaft für maschinelles Lernen, Kapitel 53 und 54

Vorherige Kapitel


Teilfehleranalyse


53. Analyse von Fehlern in Teilen


Das System sei ein Verbundförderer, der aus Modulen mit maschinellem Lernen besteht. Welche Komponente dieses Systems sollte zuerst verbessert werden? Durch die Korrelation von Systemfehlern mit bestimmten Elementen des Förderers kann eine Entscheidung über die Priorisierung der Arbeit getroffen werden.


Kehren wir zu unserem Beispiel für einen siamesischen Katzenklassifikator zurück:



Das erste Element des Systems - ein Katzendetektor - erkennt und schneidet ein Fragment mit einer Katze aus dem Bild aus. Das zweite Element - die Kennung der Rasse - entscheidet, ob die siamesische Katze auf dem Fragment ist oder nicht. Sie können jahrelang daran arbeiten, eine dieser beiden Komponenten zu verbessern. Wie kann man entscheiden, auf welches man sich konzentrieren soll?


Die Verwendung der Fehleranalyse in Teilen impliziert, dass wir für jeden Fehler versuchen, das Ergebnis der Operation zu bestimmen, um welches Modul (oder manchmal mehrere) des Verbundsystems es sich handelt. Beispielsweise stellt das System fälschlicherweise fest, dass das Bild keine siamesische Katze enthält (y = 0), obwohl er darauf abgebildet ist und das richtige Etikett y = 1 lautet.


Bild!


Lassen Sie uns die Ergebnisse jedes Moduls des Systems manuell analysieren. Angenommen, ein Katzendetektor erkennt eine Katze wie folgt:


Bild


, :


Bild


, . y = 0. , , y = 0. , . , , :


Bild


, « ». , 100 , 90 , 10 « ». « ».


, . , . , , .


54. «»


:


Bild


:


Bild


« » , , , y = 0 ( ).


Bild


, « » , , , , , . , , « », « ».


, . , , , :


1. , ,



2. « » . « » , «». , «».


, , « » «» .


:


  • 1: «» , « » - y = 0. , , .
  • Fall 2: Auf einem perfekt geschnittenen Fragment gibt der „Rassenklassifikator“ korrekt y = 1 zurück. Wenn also der Katzendetektor ein besseres Fragment erzeugt, wäre die allgemeine Schlussfolgerung des Systems korrekt. In diesem Fall führen wir den Fehler auf den „Katzendetektor“ zurück.

Durch die Analyse derart falsch klassifizierter Beispiele für Validierungsmuster können wir jeden Fehler eindeutig der einen oder anderen Komponente des Systems zuordnen. Dieser Ansatz ermöglicht es uns, den Anteil der Fehler pro Element des Systems abzuschätzen und daher zu entscheiden, auf welches wir uns konzentrieren möchten.


Fortsetzung


All Articles