Hallo alle zusammen! Mein Name ist Sasha, ich bin CTO & Mitbegründer bei LoyaltyLab. Vor zwei Jahren ging ich wie alle armen Studenten abends mit Freunden auf ein Bier zum nächsten Laden in der Nähe meines Hauses. Wir waren sehr verärgert darüber, dass der Einzelhändler, der wusste, dass wir ein Bier holen würden, keinen Rabatt auf Chips oder Cracker anbot, obwohl dies so logisch ist! Wir haben nicht verstanden, warum diese Situation eintrat, und beschlossen, unser Unternehmen zu gründen. Schreiben Sie sich als Bonus jeden Freitag Rabatte für die Chips.

Und alles ging so weit, dass ich bei NVIDIA GTC mit Material auf der technischen Seite des Produkts spreche . Wir freuen uns, unsere Best Practices mit der Community zu teilen, daher veröffentliche ich meinen Bericht in Form eines Artikels.
EinfĂĽhrung
Wie alles zu Beginn der Reise haben wir mit einer ĂśberprĂĽfung der Erstellung von Empfehlungssystemen begonnen. Am beliebtesten war die Architektur des folgenden Typs:

:
- , .
- c .
:
- candidate/ — user-product, .
- candidates extraction/extractor/ — “ ” .
. — ALS. , , . , , . , ALS, baseline’.
, , , realtime , , 30 , , , . , , , , — , .
baseline , ALS . , , :
- Precision — .
- Recall — , target .
- F1-score — F-, .
. 3 :
- precision@5 — -5 .
- response-rate@5 — ( 5 ).
- avg roc-auc per user — roc-auc .
, time-series -, k , test k+1 . / . -, — . , .
, , baseline, ALS .
:

:

, . , , , , “ , ”. , , :
- .
- , .
- .
- /.
- ( ).
- , , (Word2Vec, DSSM, etc.).
, . , K ( 1-3 ), K . , :

, , , recall precision . “ 2 ”.
,
, “ ” , , , - . . , ALS, , . “ ” , , / , , , , , . 2 :

k — , 14 .
, , .
, - . , //. , - . — , k . , . :

, , , . :

2 , :
- , , K .
- , .
, :

ft — , K ( K=5)
tm — ,
, (0, 0) recall precision, . , , k , .
— , . -k “” / “” /. “” “” . . , , , . . :

“category” .
, , , “” .
, — . 2 , [ i]-[ j], j > i, . producti-productj , producti . -k , . :

:

, : , , . , , , .
:

k — , .
, k=4. 4 .
, ,
— , . 3:
- ALS
- Word2Vec (Item2Vec )
- DSSM
ALS , , . Word2Vec, gensim. , , . , , “” ( ). ecommerce , Ozon. DSSM . Microsoft, , research paper. :

Q — query, , D[i] — document, -. , . (multilayer perceptron). , .
, , — . :

— ALS DSSM , Word2Vec . 3 :
- , , .
- .
- TF-IDF .
, , , , . 1, , ½, ⅓, .:

TF-IDF , TF-IDF , , , , — . , . :

. ALS:

Item2Vec :

, baseline. , k . , , 50-70 .
DSSM:

?
, , ? ? :
- - . , , , .
- ?
, : , . , , , “ ” “ ”.
, , : (recall). , , . .

— , recall — . 2 , :
, «, » , . , “ ” . , . , .
:

:

, , . , , , . , . , , :
- / .
- .
- .
, , . , . . , :
- / .
- , . , -.
- , , .
:

overall products conversion — , .
. , , , . , , .
, , , , — 3-4%:

, , realtime , . , .
, . telegram. AI/ telegram — welcome :)