рджреВрд╕рд░реЗ рдкреНрд░рдХрд╛рд░ рдХреА рддреНрд░реБрдЯрд┐ рдХреА рдХрдо рд╕рдВрднрд╛рд╡рдирд╛ рдХреЗ рд╕рд╛рде рдЫрд╡рд┐ рдкрд░ рд╕рдВрдЦреНрдпрд╛ рдкрд╣рдЪрд╛рди рдПрд▓реНрдЧреЛрд░рд┐рдереНрдо

рдЫрд╡рд┐

рдЙрджреНрдпреЛрдЧ рдореЗрдВ рдРрд╕реЗ рдХрдИ рдорд╛рдорд▓реЗ рд╣реИрдВ рдЬрд┐рдирдореЗрдВ
рджреГрд╢реНрдп рд╕рдВрдЦреНрдпрд╛ рдкрд╣рдЪрд╛рди рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реЛрддреА рд╣реИ ред рдЕрдХреНрд╕рд░, рдкрд╣рдЪрд╛рди рдПрд▓реНрдЧреЛрд░рд┐рдереНрдо рдХреЗ рд▓рд┐рдП рдЖрд╡рд╢реНрдпрдХ рд╕реНрдерд┐рддрд┐ рджреВрд╕рд░реА рддрд░рд╣ рдХреА рддреНрд░реБрдЯрд┐ рдХрд╛ рдПрдХ рдХрдо рдореВрд▓реНрдп рд╣реИ, рдЕрд░реНрдерд╛рддреН, рдРрд╕реЗ рдорд╛рдорд▓реЗ рдЬрдм рдХреЛрдИ рдЕрдорд╛рдиреНрдп рд╕рдВрдЦреНрдпрд╛ рдкрд╣рдЪрд╛рдиреА рдЬрд╛рддреА рд╣реИред рдРрд╕реЗ рдХрд╛рд░реНрдпреЛрдВ рдХрд╛ рдПрдХ рдЙрджрд╛рд╣рд░рдг рд╣реИ:


  1. рдЫреВрдЯ, рдмреИрдВрдХ рдХрд╛рд░реНрдб, рдЪрд┐рддреНрд░рд╛ 1 рдкрд░ рд╕рдВрдЦреНрдпрд╛ рдХреА рдорд╛рдиреНрдпрддрд╛ред
  2. рдХрд╛рд░ рдирдВрдмрд░ рдХреА рдорд╛рдиреНрдпрддрд╛, рдЪрд┐рддреНрд░ 2ред

рдЫрд╡рд┐

1 тАУ
2 тАУ ,


, , :


  • ;
  • ( );
  • , , ..


(scene number recognition) : 0.03.


false positive (FP) тАФ , . , "177", "777", .



, CRNN (Convolutional Reccurent Neural Network)[1].


github.


Python3, PyTorch.


PSPNet[2]. , github PSPNet Pytorch.



CRNN,
medium [3], [4].


CRNN 3.


рдЫрд╡рд┐

3 тАУ CRNN


. , : CNN [5], LSTM [6].


:


  1. CNN. . , , , , . , . , , 4;
  2. LSTM. LSTM (time step). LSTM . LSTM many to many, . , Bidirectional LSTM, ;
  3. . . тАФ ;
  4. . n Yn: kn = max(Yn). , , . , , : ┬л3200-544┬╗. "-" , . , ┬л00┬╗ ┬л44┬╗, .

рдЫрд╡рд┐

4 тАУ
: h, w тАФ ; n тАФ .



, , 5.


рдЫрд╡рд┐

5тАК тАУ тАК

, : .


.


CRNN , 6.


рдЫрд╡рд┐

тАК 6 тАУ . : , , . CRNN 1, CRNN 2 тАФ


, , . - .


.

, "5" , . , , . , :


x=s+v,v>x
: s тАФ , v тАФ , x тАФ .


. , :


y=f(x),yтИ╝U
: f тАФ , x тАФ , y тАФ .


10 pf = 0.9.


:


pf = тИСi=1,j=110P(y=yj|yi=yj)
: pf тАФ , yiтАФ i- , yjтАФ j- .


10 , pf = 0.1, pf = 0.9 .
, ps = 0.97, : pk = 0.97*0.97 = 0.94.


: .
, , . , S = (280, 64), S2 = (320, 64).


, . S = (280, 64), 1.


рдЫрд╡рд┐

1 тАУ .
: BS тАФ ; AS тАФ ; k, s, p тАФ , , , : max_pooling



. , . PSPNet.


400 , тАФ 100 , , , 5-10 % , , 5.



2 тАУ . inter_bad тАФ , inter_good тАФ ; good_1, good_2 тАФ , ; amount_cards тАФ , percent_good_1, percent_good_2 тАФ , ; percent_good тАФ ; percent_bad тАФ

, , 1, 0.8816, 0.1184. , - .


, 0.0177, 0.863813, 0.0954 0.0230. , .






, тАФ

, ,




:


  • . , . , , ;
  • . , ;
  • . .


, CRNN scene text recognition, .
CRNN, , .


рдЗрд╕ рджреГрд╖реНрдЯрд┐рдХреЛрдг рдХреЗ рдЕрд▓рд╛рд╡рд╛, рдореИрдВрдиреЗ рдПрдХ рдирд┐рд╢реНрдЪрд┐рдд рд╕реАрдорд╛ рд╕реЗ рдХрдо рд╕рдВрднрд╛рд╡рдирд╛ рдХреЗ рд╕рд╛рде рдЭреВрдареА рднрд╡рд┐рд╖реНрдпрд╡рд╛рдгрд┐рдпреЛрдВ рдХреЛ рдХрд╛рдЯрдиреЗ рдХреА рдХреЛрд╢рд┐рд╢ рдХреА, рд╣рд╛рд▓рд╛рдВрдХрд┐, рдЗрд╕ рдорд╛рдорд▓реЗ рдореЗрдВ, рднрд╡рд┐рд╖реНрдпрд╡рд╛рдгреА рдХреА рд╕рдЯреАрдХрддрд╛ 0.3 рддрдХ рдЧрд┐рд░ рдЧрдИ, рдЬреЛ рдЕрд╕реНрд╡реАрдХрд╛рд░реНрдп рдереАред


рд╕реВрддреНрд░реЛрдВ рдХреА рд╕реВрдЪреА


  1. рдореВрд▓ CRNN рд▓реЗрдЦ;
  2. рдкрд┐рд░рд╛рдорд┐рдб рджреГрд╢реНрдп рдкрд╛рд░реНрд╕рд┐рдВрдЧ рдиреЗрдЯрд╡рд░реНрдХ
  3. TensorFlow рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░ рдПрдХ рд╣рд╕реНрддрд▓рд┐рдЦрд┐рдд рдкрд╛рда рдорд╛рдиреНрдпрддрд╛ рдкреНрд░рдгрд╛рд▓реА рдХрд╛ рдирд┐рд░реНрдорд╛рдг;
  4. рдХрдиреЗрдХреНрд╢рдирд╡рд╛рджреА рдЯреЗрдореНрдкреЛрд░рд▓ рд╡рд░реНрдЧреАрдХрд░рдг рдХрд╛ рдПрдХ рд╕рд╣рдЬ рд╡реНрдпрд╛рдЦреНрдпрд╛;
  5. рдЕрдЬрдЧрд░ рдореЗрдВ рд╕рдВрд╡реЗрдЧрд╛рддреНрдордХ рддрдВрддреНрд░рд┐рдХрд╛ рдиреЗрдЯрд╡рд░реНрдХ
  6. LSTM - рджреАрд░реНрдШрдХрд╛рд▓рд┐рдХ рдЕрд▓реНрдкрдХрд╛рд▓рд┐рдХ рдореЗрдореЛрд░реА рдХреЗ рд▓рд┐рдП рдиреЗрдЯрд╡рд░реНрдХ

All Articles