Tradução do livro de Andrew Un, Passion for Machine Learning, capítulos 53 e 54

Capítulos anteriores


Análise de erro parcial


53. Análise de erros em partes


Deixe o sistema ser um transportador composto que consiste em módulos com aprendizado de máquina. Qual componente deste sistema deve ser melhorado primeiro? Ao correlacionar os erros do sistema com elementos específicos do transportador, é possível tomar uma decisão sobre a priorização do trabalho.


Vamos voltar ao nosso exemplo de classificador de gatos siameses:



O primeiro elemento do sistema - um detector de gato, detecta e corta um fragmento com um gato da imagem. O segundo elemento - o identificador da raça, decide se o gato siamês está no fragmento ou não. Você pode passar anos trabalhando para melhorar qualquer um desses dois componentes. Como decidir em qual deles focar?


O uso da análise de erros em partes implica que, para cada erro, estamos tentando determinar o resultado da operação de qual módulo (ou às vezes vários) do sistema composto é. Por exemplo, o sistema determina incorretamente que a imagem não possui um gato siamês (y = 0), apesar de estar representada nele e o rótulo correto ser y = 1.


imagem!


Vamos analisar manualmente os resultados de cada módulo do sistema. Suponha que um detector de gato detecte um gato da seguinte maneira:


imagem


, :


imagem


, . y = 0. , , y = 0. , . , , :


imagem


, « ». , 100 , 90 , 10 « ». « ».


, . , . , , .


54. «»


:


imagem


:


imagem


« » , , , y = 0 ( ).


imagem


, « » , , , , , . , , « », « ».


, . , , , :


1. , ,



2. « » . « » , «». , «».


, , « » «» .


:


  • 1: «» , « » - y = 0. , , .
  • Caso 2: em um fragmento perfeitamente cortado, o “classificador de raças” retorna corretamente y = 1. Assim, se o detector de gatos fornecer um fragmento melhor, a conclusão geral do sistema estará correta. Nesse caso, atribuímos o erro ao "detector de gato".

Ao analisar exemplos assim classificados incorretamente de amostras de validação, podemos atribuir inequivocamente cada erro a um ou outro componente do sistema. Essa abordagem permite estimar a proporção de erros por cada elemento do sistema e, portanto, decidir em qual deles se concentrar.


continuação


All Articles