¡Hola a todos! Mi nombre es Sasha, soy CTO y cofundador de LoyaltyLab. Hace dos años, fui con amigos, como todos los estudiantes pobres, por la noche a tomar una cerveza a la tienda más cercana cerca de mi casa. Nos molestĂł mucho que el minorista, sabiendo que vendrĂamos por una cerveza, no ofrecĂa un descuento en papas fritas o galletas saladas, ¡aunque esto es tan lĂłgico! No entendĂamos por quĂ© estaba sucediendo esta situaciĂłn y decidimos hacer nuestra empresa. Bueno, como beneficio adicional, escriba descuentos todos los viernes para las mismas fichas.

Y todo fue tan lejos que hablo en NVIDIA GTC con material en el aspecto tĂ©cnico del producto . Nos complace compartir nuestras mejores prácticas con la comunidad, por lo que publico mi informe en forma de artĂculo.
IntroducciĂłn
Como todo al comienzo del viaje, comenzamos con una revisión de cómo se hacen los sistemas de recomendación. Y la más popular fue la arquitectura del siguiente tipo:

:
- , .
- c .
:
- candidate/ — user-product, .
- candidates extraction/extractor/ — “ ” .
. — ALS. , , . , , . , ALS, baseline’.
, , , realtime , , 30 , , , . , , , , — , .
baseline , ALS . , , :
- Precision — .
- Recall — , target .
- F1-score — F-, .
. 3 :
- precision@5 — -5 .
- response-rate@5 — ( 5 ).
- avg roc-auc per user — roc-auc .
, time-series -, k , test k+1 . / . -, — . , .
, , baseline, ALS .
:

:

, . , , , , “ , ”. , , :
- .
- , .
- .
- /.
- ( ).
- , , (Word2Vec, DSSM, etc.).
, . , K ( 1-3 ), K . , :

, , , recall precision . “ 2 ”.
,
, “ ” , , , - . . , ALS, , . “ ” , , / , , , , , . 2 :

k — , 14 .
, , .
, - . , //. , - . — , k . , . :

, , , . :

2 , :
- , , K .
- , .
, :

ft — , K ( K=5)
tm — ,
, (0, 0) recall precision, . , , k , .
— , . -k “” / “” /. “” “” . . , , , . . :

“category” .
, , , “” .
, — . 2 , [ i]-[ j], j > i, . producti-productj , producti . -k , . :

:

, : , , . , , , .
:

k — , .
, k=4. 4 .
, ,
— , . 3:
- ALS
- Word2Vec (Item2Vec )
- DSSM
ALS , , . Word2Vec, gensim. , , . , , “” ( ). ecommerce , Ozon. DSSM . Microsoft, , research paper. :

Q — query, , D[i] — document, -. , . (multilayer perceptron). , .
, , — . :

— ALS DSSM , Word2Vec . 3 :
- , , .
- .
- TF-IDF .
, , , , . 1, , ½, ⅓, .:

TF-IDF , TF-IDF , , , , — . , . :

. ALS:

Item2Vec :

, baseline. , k . , , 50-70 .
DSSM:

?
, , ? ? :
- - . , , , .
- ?
, : , . , , , “ ” “ ”.
, , : (recall). , , . .

— , recall — . 2 , :
, «, » , . , “ ” . , . , .
:

:

, , . , , , . , . , , :
- / .
- .
- .
, , . , . . , :
- / .
- , . , -.
- , , .
:

overall products conversion — , .
. , , , . , , .
, , , , — 3-4%:

, , realtime , . , .
, . telegram. AI/ telegram — welcome :)