Olá a todos! Meu nome é Sasha, sou CTO e co-fundador da LoyaltyLab. Dois anos atrás, fui com amigos, como todos os alunos pobres, à noite para tomar uma cerveja na loja mais próxima perto de minha casa. Ficamos muito chateados que o varejista, sabendo que íamos tomar uma cerveja, não oferecesse desconto em batatas fritas ou bolachas, embora isso seja tão lógico! Não entendemos por que essa situação estava acontecendo e decidimos fazer nossa empresa. Bem, como bônus, escreva para si mesmo descontos toda sexta-feira pelas próprias fichas.

E tudo foi tão longe que eu falo na NVIDIA GTC com material no lado técnico do produto . Temos o prazer de compartilhar nossas melhores práticas com a comunidade, por isso estou postando meu relatório na forma de um artigo.
Introdução
Como tudo no início da jornada, começamos com uma revisão de como os sistemas de recomendação são feitos. E o mais popular foi a arquitetura do seguinte tipo:

:
- , .
- c .
:
- candidate/ — user-product, .
- candidates extraction/extractor/ — “ ” .
. — ALS. , , . , , . , ALS, baseline’.
, , , realtime , , 30 , , , . , , , , — , .
baseline , ALS . , , :
- Precision — .
- Recall — , target .
- F1-score — F-, .
. 3 :
- precision@5 — -5 .
- response-rate@5 — ( 5 ).
- avg roc-auc per user — roc-auc .
, time-series -, k , test k+1 . / . -, — . , .
, , baseline, ALS .
:

:

, . , , , , “ , ”. , , :
- .
- , .
- .
- /.
- ( ).
- , , (Word2Vec, DSSM, etc.).
, . , K ( 1-3 ), K . , :

, , , recall precision . “ 2 ”.
,
, “ ” , , , - . . , ALS, , . “ ” , , / , , , , , . 2 :

k — , 14 .
, , .
, - . , //. , - . — , k . , . :

, , , . :

2 , :
- , , K .
- , .
, :

ft — , K ( K=5)
tm — ,
, (0, 0) recall precision, . , , k , .
— , . -k “” / “” /. “” “” . . , , , . . :

“category” .
, , , “” .
, — . 2 , [ i]-[ j], j > i, . producti-productj , producti . -k , . :

:

, : , , . , , , .
:

k — , .
, k=4. 4 .
, ,
— , . 3:
- ALS
- Word2Vec (Item2Vec )
- DSSM
ALS , , . Word2Vec, gensim. , , . , , “” ( ). ecommerce , Ozon. DSSM . Microsoft, , research paper. :

Q — query, , D[i] — document, -. , . (multilayer perceptron). , .
, , — . :

— ALS DSSM , Word2Vec . 3 :
- , , .
- .
- TF-IDF .
, , , , . 1, , ½, ⅓, .:

TF-IDF , TF-IDF , , , , — . , . :

. ALS:

Item2Vec :

, baseline. , k . , , 50-70 .
DSSM:

?
, , ? ? :
- - . , , , .
- ?
, : , . , , , “ ” “ ”.
, , : (recall). , , . .

— , recall — . 2 , :
, «, » , . , “ ” . , . , .
:

:

, , . , , , . , . , , :
- / .
- .
- .
, , . , . . , :
- / .
- , . , -.
- , , .
:

overall products conversion — , .
. , , , . , , .
, , , , — 3-4%:

, , realtime , . , .
, . telegram. AI/ telegram — welcome :)