рд╡рд░реНрд╖ 2018 рдкрд╛рда рдкреНрд░рд╕рдВрд╕реНрдХрд░рдг рд╕рдорд╕реНрдпрд╛рдУрдВ (рдпрд╛, рдЕрдзрд┐рдХ рд╕рд╣реА рдврдВрдЧ рд╕реЗ, рдкреНрд░рд╛рдХреГрддрд┐рдХ рднрд╛рд╖рд╛ рдкреНрд░рд╕рдВрд╕реНрдХрд░рдг (рдПрдирдПрд▓рдкреА)) рдХреЛ рд╣рд▓ рдХрд░рдиреЗ рдХреЗ рдЙрджреНрджреЗрд╢реНрдп рд╕реЗ рдорд╢реАрди рд▓рд░реНрдирд┐рдВрдЧ рдореЙрдбрд▓ рдХреЗ рд╡рд┐рдХрд╛рд╕ рдХреЗ рд▓рд┐рдП рдПрдХ рдорд╣рддреНрд╡рдкреВрд░реНрдг рдмрд┐рдВрджреБ рдерд╛ред рдЕрдкрдиреЗ рдЕрд░реНрде рд╕рдВрдмрдВрдзреА рдЕрд░реНрдереЛрдВ рдФрд░ рдЙрдирдХреЗ рдмреАрдЪ рд╕рдВрдмрдВрдзреЛрдВ рдХреЗ рд╕рдмрд╕реЗ рд╕рдЯреАрдХ рдирд┐рд╖реНрдХрд░реНрд╖рдг рдХреЗ рд▓рд┐рдП рд╢рдмреНрджреЛрдВ рдФрд░ рд╡рд╛рдХреНрдпреЛрдВ рдХреЛ рдХреИрд╕реЗ рдкреНрд░рд╕реНрддреБрдд рдХрд┐рдпрд╛ рдЬрд╛рдП, рдЗрд╕рдХреА рдПрдХ рд╡реИрдЪрд╛рд░рд┐рдХ рд╕рдордЭ рддреЗрдЬреА рд╕реЗ рдмрдврд╝ рд░рд╣реА рд╣реИред рдЗрд╕рдХреЗ рдЕрд▓рд╛рд╡рд╛, рдПрдирдПрд▓рдкреА рд╕рдореБрджрд╛рдп рдЕрд╡рд┐рд╢реНрд╡рд╕рдиреАрдп рд░реВрдк рд╕реЗ рд╢рдХреНрддрд┐рд╢рд╛рд▓реА рдЙрдкрдХрд░рдг рдХреЛ рдмрдврд╝рд╛рд╡рд╛ рджреЗрддрд╛ рд╣реИ рдЬрд┐рд╕реЗ рдбрд╛рдЙрдирд▓реЛрдб рдХрд┐рдпрд╛ рдЬрд╛ рд╕рдХрддрд╛ рд╣реИ рдФрд░ рдЙрдирдХреЗ рдореЙрдбрд▓ рдФрд░ рдкрд╛рдЗрдкрд▓рд╛рдЗрдиреЛрдВ рдореЗрдВ рдореБрдлреНрдд рдореЗрдВ рдЙрдкрдпреЛрдЧ рдХрд┐рдпрд╛ рдЬрд╛ рд╕рдХрддрд╛ рд╣реИред рдЗрд╕ рдЯрд┐рдкрд┐рдВрдЧ рдкреЙрдЗрдВрдЯ рдХреЛ рдПрдирдПрд▓рдкреА рдХрд╛ рдЗрдореЗрдЬрдиреЗрдЯ рдкрд▓ рднреА рдХрд╣рд╛ рдЬрд╛рддрд╛ рд╣реИ , рдХрдИ рд╕рд╛рд▓ рдкрд╣рд▓реЗ рдХреЗ рдЙрд╕ рдХреНрд╖рдг рдХрд╛ рдЬрд┐рдХреНрд░, рдЬрдм рдЗрд╕реА рддрд░рд╣ рдХреЗ рд╡рд┐рдХрд╛рд╕ рдиреЗ рдХрдВрдкреНрдпреВрдЯрд░ рд╡рд┐рдЬрд╝рди рд╕рдорд╕реНрдпрд╛рдУрдВ рдХреЗ рдХреНрд╖реЗрддреНрд░ рдореЗрдВ рдорд╢реАрди рд▓рд░реНрдирд┐рдВрдЧ рдХреЗ рд╡рд┐рдХрд╛рд╕ рдХреЛ рдХрд╛рдлреА рддреЗрдЬ рдХрд░ рджрд┐рдпрд╛ рдерд╛ред
![рдЯреНрд░рд╛рдВрд╕рдлрд╛рд░реНрдорд░-рдмреЗрд░-ulmfit-рдПрд▓реНрдореЛ](https://habrastorage.org/webt/uh/cd/qv/uhcdqv--w2t4i8srv9rtzjgk9ac.png)
(ULM-FiT рдХрд╛ рдХреЛрдЭрд┐рдХ рд╕реЗ рдХреЛрдИ рд▓реЗрдирд╛ рджреЗрдирд╛ рдирд╣реАрдВ рд╣реИ, рд▓реЗрдХрд┐рди рдХреБрдЫ рдмреЗрд╣рддрд░ рдирд╣реАрдВ рд╣реБрдЖ)
тАУ BERT', , NLP. BERT тАУ , NLP-. , , BERT', . , , , .
![рдмрд░реНрдЯ-рд╣рд╕реНрддрд╛рдВрддрд░рдг-рд▓рд░реНрдирд┐рдВрдЧ](https://habrastorage.org/webt/pz/zk/xy/pzzkxyzmqf21r5rik00228zntwm.png)
BERT'. 1: ( ); 2: .
BERT , NLP-, , : Semi-supervised Sequence learning ( тАУ Andrew Dai Quoc Le), ELMo ( тАУ Matthew Peters AI2 UW CSE), ULMFiT ( тАУ fast.ai Jeremy Howard Sebastian Ruder), OpenAI Transformer ( тАУ OpenAI Radford, Narasimhan, Salimans, Sutskever) (Vaswani et al).
, , BERT'. , , .
:
BERT тАУ . :
![рдмрд░реНрдЯ-рд╡рд░реНрдЧреАрдХрд░рдг рд╕реНрдкреИрдо](https://habrastorage.org/webt/mx/eo/u_/mxeou__qytr_9_2m6pxjo2icemc.png)
, , (classifier) BERT' . (fine-tuning), Semi-supervised Sequence Learning ULMFiT.
, : , . . (┬л┬╗ ┬л ┬╗).
![рд╕реНрдкреИрдо рд▓реЗрдмрд▓-рдбрд╛рдЯрд╛рд╕реЗрдЯ](https://habrastorage.org/webt/hy/qr/pa/hyqrpadlqytj81eqk3xtkyr3fcu.png)
BERT':
- (sentiment analysis)
- (fact-checking):
- : . : ┬л┬╗ (Claim) ┬л ┬╗ (Not Claim)
- / :
- : (Claim sentence). : ┬л┬╗ ┬л┬╗
- Full Fact тАУ , . , , ( , , , )
- :
, BERT', , .
![рдмрд░реНрдЯ рдЖрдзрд╛рд░-рдмрд░реНрдЯ-рдмрдбрд╝реЗ](https://habrastorage.org/webt/i3/u4/fq/i3u4fq9cclcq0-zeqfk56b5y78i.png)
BERT' :
- BERT BASE () тАУ OpenAI Transformer;
- BERT LARGE () тАУ , (state of the art), .
, BERT тАУ . . , тАУ BERTтАЩ , .
![рдмрд░реНрдЯ рдЖрдзрд╛рд░-рдмрд░реНрдЯ-рдмрдбрд╝реЗ рдПрдирдХреЛрдбрд░](https://habrastorage.org/webt/6k/ce/se/6kcesezyar2zqppjc31sfkcsxak.png)
BERT' ( ┬л ┬╗ (Transformer Blocks)): 12 24 . (768 1024 ) ┬л┬╗ (attention heads)(12 16 ), , (6 , 512 , 8 ┬л┬╗ ).
![рдмрд░реНрдЯ-рдЗрдирдкреБрдЯ-рдЖрдЙрдЯрдкреБрдЯ](https://habrastorage.org/webt/ed/7k/go/ed7kgoai63syz-koc-_tlqs0gwk.png)
[CLS] , . CLS .
, , BERT , . (self-attention) , .
![рдмрд░реНрдЯ-рдПрдирдХреЛрдбрд░ рдЗрдирдкреБрдЯ](https://habrastorage.org/webt/jp/kd/qs/jpkdqszmo06ogw7xbfk1tqmz0kw.png)
, ( , ). .
hidden_size (768 BERT'). , , ( [CLS]).
![рдмрд░реНрдЯ-рдЙрддреНрдкрд╛рджрди-рд╡реЗрдХреНрдЯрд░](https://habrastorage.org/webt/at/9b/xe/at9bxefqh-vnkxlc-xkuxlgi13s.png)
. , .
![рдмрд░реНрдЯ-рд╡рд░реНрдЧреАрдХрд╛рд░рдХ](https://habrastorage.org/webt/ee/lg/99/eelg99xutp6h7oztqyyz3hv-5e4.png)
(, ┬л┬╗, ┬л ┬╗, ┬л ┬╗, ┬л┬╗ .), .
, , , VGGNet .
![VGG рдирд┐рд╡рд▓ рд╡рд░реНрдЧреАрдХрд╛рд░рдХ](https://habrastorage.org/webt/sl/37/yf/sl37yfo6xriqw24ule31ukksi8q.png)
. , NLP- , : Word2Vec GloVe. , , , .
, . Word2Vec , ( ), , (.. , ┬л┬╗ тАУ ┬л┬╗ ┬л┬╗ тАУ ┬л┬╗), (, , ┬л┬╗ ┬л┬╗ , ┬л┬╗ ┬л┬╗).
, , , . , Word2Vec GloVe. GloVe ┬лstick┬╗ ( тАУ 200):
![рджрд╕реНрддрд╛рдиреЗ-embedding](https://habrastorage.org/webt/l1/u-/ad/l1u-admk5irbjkb__sq90albkx0.png)
┬лstick┬╗ GloVe тАУ 200 ( 2 ).
.
![рд╡реЗрдХреНрдЯрд░ рдмрдХреНрд╕реЗ](https://habrastorage.org/webt/gz/ji/ee/gzjieex8v-pmouar89ocbbzan-e.png)
ELMo:
GloVe, ┬лstick┬╗ . ┬л ┬╗, тАУ NLP- ( Peters et. al., 2017, McCann et. al., 2017 Peters et. al., 2018 ELMo). тАУ ┬л ┬лstick┬╗ , . , тАУ , , ?┬╗. (contextualized word-embeddings).
![рдПрд▓реНрдореЛ-embedding рд░реЙрдмрд┐рди рд╡рд┐рд▓рд┐рдпрдореНрд╕](https://habrastorage.org/webt/jr/rt/hb/jrrthbwj9xdzd4vgs5ckjgayv0m.png)
.
, , ELMo , . (bi-directional LSTM), .
![рдПрд▓реНрдореЛ-рд╢рдмреНрдж-embedding](https://habrastorage.org/webt/bf/yw/qq/bfywqqcnnk6cw6hr3l3fbl-xq-i.png)
ELMo NLP. ELMo LSTM , , .
ELMo?
ELMo тАУ , (language modeling). , , .
![рдмрд░реНрдЯ-рднрд╛рд╖рд╛-рдореЙрдбрд▓рд┐рдВрдЧ](https://habrastorage.org/webt/mq/j1/bo/mqj1bozk08fff_cglqbdcatcuao.png)
ELMo: ┬лLet's stick to┬╗, тАУ . . , . , , , , ┬лhang┬╗, ┬лout┬╗ ( ┬лhang out┬╗), ┬лcamera┬╗.
, LSTM - ELMo. , .
, ELMo LSTM тАУ , ┬л┬╗ , .
![рдПрд▓реНрдореЛ рд╕реЗ рдЖрдЧреЗ-рдкреАрдЫреЗ-рднрд╛рд╖рд╛-рдореЙрдбрд▓-рдПрдореНрдмреЗрдбрд┐рдВрдЧ](https://habrastorage.org/webt/0w/re/y4/0wrey4vtsshgd7wcgvi_k_cguzk.png)
ELMo
ELMo ( ) ( ).
![рдПрд▓реНрдореЛ-рдПрдореНрдмреЗрдбрд┐рдВрдЧ](https://habrastorage.org/webt/d8/dq/ch/d8dqchc0wxmoxmg2e79fnahk3ru.png)
ULM-FiT: NLP
ULM-FiT , тАУ . ULM-FiT .
NLP , , , .
, , , , NLP- LSTM. .
- . ? , (.. , )?
, , NLP-. . : , ( ).
![openai-рдЯреНрд░рд╛рдВрд╕рдлрд╛рд░реНрдорд░ -1](https://habrastorage.org/webt/3p/-d/q3/3p-dq3wsky9bqnz6mdfv6-y-r2o.png)
OpenAI Transformer
12 . - , . , ( ).
: , . 7 . , .. , тАУ , , .
![openai-рдЯреНрд░рд╛рдВрд╕рдлрд╛рд░реНрдорд░-рднрд╛рд╖рд╛-рдореЙрдбрд▓рд┐рдВрдЧ](https://habrastorage.org/webt/8d/l0/4k/8dl04ko7gbfw9kiq_jlg5ve281w.png)
OpenAI Transformer 7000
, OpenAI Transformer , . ( ┬л┬╗ ┬л ┬╗):
![openai-рдЯреНрд░рд╛рдВрд╕рдлрд╛рд░реНрдорд░ рд╡рд╛рдХреНрдп-рд╡рд░реНрдЧреАрдХрд░рдг](https://habrastorage.org/webt/-l/fo/hr/-lfohrojznururmmrni-ykoqnog.png)
OpenAI , . :
![рдУрдкрдирд╛рдИ-рдЗрдирдкреБрдЯ рдкрд░рд┐рд╡рд░реНрддрди](https://habrastorage.org/webt/mb/aw/na/mbawnanchccikwp7z4hhe1n0tbi.png)
, ?
BERT:
OpenAI Transformer , . - LSTM . ELMo , OpenAI Transformer . , , ( тАУ ┬л , ┬╗)?
┬л ┬╗, тАУ .
(masked language model)
┬л ┬╗, тАУ .
┬л !┬╗ тАУ . тАУ ┬л , .┬╗
┬л ┬╗, тАУ .
![рдмрд░реНрдЯ-рднрд╛рд╖рд╛-рдореЙрдбрд▓рд┐рдВрдЧ-рдирдХрд╛рдмрдкреЛрд╢-рдПрд▓ рдПрдо](https://habrastorage.org/webt/z7/m-/qm/z7m-qmmtz724m8viviqejgzsmjs.png)
BERT ┬л┬╗ 15% .
тАУ , BERT , ┬л ┬╗ (masked language model) ( ┬л-┬╗).
15% , BERT , . .
OpenAI Transformer, , - (, ? , ?).
, BERT , : ( ); , ?
![рдмрд░реНрдЯ-рдЕрдЧрд▓реА рд╡рд╛рдХреНрдп-рднрд╡рд┐рд╖реНрдпрд╡рд╛рдгреА](https://habrastorage.org/webt/rz/hr/jf/rzhrjfq5iyequzyykq9tp0urdic.png)
, BERT тАУ . , .. BERT WordPieces, тАУ .
BERT' .
![рдмрд░реНрдЯ-рдХрд╛рд░реНрдп](https://habrastorage.org/webt/03/8i/a7/038ia7qjndp3qhcz8pdkcd_14nw.png)
a) : MNLI, QQP, QNLI, STS-B, MRPC, RTE, SWAG; b) : SST-2, CoLA; c) - : SQuAD v1.1; d) : CoNLL-2003 NER.
BERT
тАУ BERT. ELMo, BERT' . тАУ , , , , (named-entity recognition).
![рдмрд░реНрдЯ-contexualized-embeddings](https://habrastorage.org/webt/ob/pa/a6/obpaa6snqryacqb9vbyaahue7zc.png)
? . 6 ( , 96,4):
![рдмрд░реНрдЯ-рд╕реБрд╡рд┐рдзрд╛ рдирд┐рд╖реНрдХрд░реНрд╖рдг-contextualized-embeddings](https://habrastorage.org/webt/ir/vr/sv/irvrsv9mefroz7io6ilnjng3fo4.png)
- BERT'
BERT тАУ BERT FineTuning with Cloud TPUs, Google Colab. Cloud TPU, , .. BERT' TPU, CPU GPU.
тАУ BERT':
PyTorch- BERT'. AllenNLP BERT'a .