Algoritma pengenalan angka pada gambar dengan probabilitas rendah dari jenis kesalahan kedua

gambar

Ada sejumlah kasus dalam industri yang membutuhkan
pengenalan nomor adegan. Seringkali, kondisi yang diperlukan untuk algoritma pengakuan adalah nilai rendah dari jenis kesalahan kedua, yaitu, kasus ketika angka yang tidak valid dikenali. Contoh dari tugas tersebut adalah:


  1. Pengakuan nomor pada diskon, kartu bank, Gambar 1.
  2. Pengenalan nomor mobil, Gambar 2.

gambar

1 –
2 – ,


, , :


  • ;
  • ( );
  • , , ..


(scene number recognition) : 0.03.


false positive (FP) β€” , . , "177", "777", .



, CRNN (Convolutional Reccurent Neural Network)[1].


github.


Python3, PyTorch.


PSPNet[2]. , github PSPNet Pytorch.



CRNN,
medium [3], [4].


CRNN 3.


gambar

3 – CRNN


. , : CNN [5], LSTM [6].


:


  1. CNN. . , , , , . , . , , 4;
  2. LSTM. LSTM (time step). LSTM . LSTM many to many, . , Bidirectional LSTM, ;
  3. . . β€” ;
  4. . n Yn: kn = max(Yn). , , . , , : Β«3200-544Β». "-" , . , Β«00Β» Β«44Β», .

gambar

4 –
: h, w β€” ; n β€” .



, , 5.


gambar

5β€Š – β€Š

, : .


.


CRNN , 6.


gambar

β€Š 6 – . : , , . CRNN 1, CRNN 2 β€”


, , . - .


.

, "5" , . , , . , :


x=s+v,v>x
: s β€” , v β€” , x β€” .


. , :


y=f(x),y∼U
: f β€” , x β€” , y β€” .


10 pf = 0.9.


:


pf = βˆ‘i=1,j=110P(y=yj|yi=yj)
: pf β€” , yiβ€” i- , yjβ€” j- .


10 , pf = 0.1, pf = 0.9 .
, ps = 0.97, : pk = 0.97*0.97 = 0.94.


: .
, , . , S = (280, 64), S2 = (320, 64).


, . S = (280, 64), 1.


gambar

1 – .
: BS β€” ; AS β€” ; k, s, p β€” , , , : max_pooling



. , . PSPNet.


400 , β€” 100 , , , 5-10 % , , 5.



2 – . inter_bad β€” , inter_good β€” ; good_1, good_2 β€” , ; amount_cards β€” , percent_good_1, percent_good_2 β€” , ; percent_good β€” ; percent_bad β€”

, , 1, 0.8816, 0.1184. , - .


, 0.0177, 0.863813, 0.0954 0.0230. , .






, β€”

, ,




:


  • . , . , , ;
  • . , ;
  • . .


, CRNN scene text recognition, .
CRNN, , .


Selain pendekatan ini, saya mencoba untuk memotong prediksi palsu dengan probabilitas kurang dari ambang tertentu, namun, dalam hal ini, akurasi prediksi turun menjadi 0,3, yang tidak dapat diterima.


Daftar sumber


  1. Artikel CRNN asli;
  2. Jaringan parsing adegan piramida
  3. Membangun Sistem Pengenalan Teks Tulisan Tangan menggunakan TensorFlow;
  4. Penjelasan Intuitif Klasifikasi Temporal Connectionist;
  5. Jaringan saraf convolutional dengan python
  6. LSTM - Jaringan Memori Jangka Pendek Jangka Panjang

All Articles