
资料来源:https : //wiki.loginom.ru/articles/clustering.html
在过去的几十年中,文本识别的任务并没有失去其意义。现在,在广泛采用文件远程处理的时期,如果没有一种识别人的程序便无法做到。
, . , , . , . , . , . , . . , ?
, , . , , -. , .
, , “” , . ( ) .
, , , , , . . , , “ ”. .
, .
: [1]. , . , , , . , , , , , .
, , : , .
, , , , “” . : “” “”, — 6 . :
, [2] . . , , : , , . 285421 , 142515 142906 .
: 6 . , . 1500024 , (“0”, , “1” — ).
, , , . 10000 , . , , , .
. . :

M — , pi — i- , ei — i- .
. .
:

p-, , e — , α — , . α , , , , .
( ), “” .
. , , , — . , , .
, (. ).
3 . , , .
. , .. .
, , . , , , .
— . , . , . , , . , - .
- Koch G., Zemel R., Salakhutdinov R. Siamese Neural Networks for One-shot Image Recognition. Proceedings of the 32 International Conference on Machine Learning. 2015. V. 2. 8 p.
- Chernyshova Y., Gayer A., Sheshkus A. Generation method of synthetic training data for mobile OCR system. Proc. SPIE 10696, Tenth International Conference on Machine Vision (ICMV 2017). 2018. P. 1-7. DOI: 10.1117/12.2310119.