Terjemahan buku Andrew Un, Passion for Machine Learning, Bab 53 dan 54

bab sebelumnya


Analisis kesalahan parsial


53. Analisis kesalahan dalam bagian


Biarkan sistem menjadi konveyor komposit yang terdiri dari modul dengan pembelajaran mesin. Komponen apa dari sistem ini yang harus diperbaiki terlebih dahulu? Dengan mengkorelasikan kesalahan sistem dengan elemen spesifik konveyor, keputusan dapat dibuat tentang memprioritaskan pekerjaan.


Mari kita kembali ke contoh pengklasifikasi kucing Siam:



Elemen pertama dari sistem - detektor kucing, mendeteksi dan memotong sebuah fragmen dengan kucing dari gambar. Elemen kedua - pengidentifikasi dari trah, memutuskan apakah kucing siam di fragmen atau tidak. Anda dapat menghabiskan waktu bertahun-tahun bekerja untuk memperbaiki salah satu dari dua komponen ini. Bagaimana cara memutuskan yang mana yang menjadi fokus?


Penggunaan analisis kesalahan di bagian menyiratkan bahwa untuk setiap kesalahan kami mencoba untuk menentukan hasil operasi modul mana (atau kadang-kadang beberapa) dari sistem komposit itu. Sebagai contoh, sistem salah menentukan bahwa gambar tidak memiliki kucing siam (y = 0), terlepas dari kenyataan bahwa itu digambarkan di atasnya dan label yang benar adalah y = 1.


gambar!


Mari kita secara manual menganalisis hasil dari setiap modul sistem. Misalkan pendeteksi kucing mendeteksi kucing sebagai berikut:


gambar


, :


gambar


, . y = 0. , , y = 0. , . , , :


gambar


, « ». , 100 , 90 , 10 « ». « ».


, . , . , , .


54. «»


:


gambar


:


gambar


« » , , , y = 0 ( ).


gambar


, « » , , , , , . , , « », « ».


, . , , , :


1. , ,



2. « » . « » , «». , «».


, , « » «» .


:


  • 1: «» , « » - y = 0. , , .
  • Kasus 2: pada fragmen yang dipotong sempurna, "breed classifier" dengan benar mengembalikan y = 1. Dengan demikian, jika detektor kucing menghasilkan fragmen yang lebih baik, kesimpulan umum sistem akan benar. Dalam hal ini, kami mengaitkan kesalahan dengan "detektor kucing".

Dengan menganalisis contoh sampel validasi yang diklasifikasi secara keliru, kami dapat mengaitkan masing-masing kesalahan dengan salah satu komponen sistem. Pendekatan ini memungkinkan kami untuk memperkirakan proporsi kesalahan per masing-masing elemen sistem, dan, oleh karena itu, memutuskan yang mana yang menjadi fokus.


kelanjutan


All Articles