كيف قمنا بتحسين جودة التوصيات بشكل متكرر في البيع بالتجزئة دون اتصال بالإنترنت

تحية للجميع! اسمي ساشا ، أنا CTO وشريك مؤسس في LoyaltyLab. قبل عامين ، ذهبت مع الأصدقاء ، مثل جميع الطلاب الفقراء ، في المساء لتناول الجعة إلى أقرب متجر بالقرب من منزلي. كنا مستائين للغاية من أن بائع التجزئة ، مع العلم أننا سنأتي لجعة ، لم يقدم خصمًا على الرقائق أو المفرقعات ، على الرغم من أن هذا أمر منطقي للغاية! لم نفهم سبب حدوث هذا الموقف وقررنا أن نجعل شركتنا. حسنًا ، كمكافأة ، اكتب خصومات لنفسك كل يوم جمعة للرقائق ذاتها.


صورة


وذهب كل هذا إلى حد أنني أتحدث في NVIDIA GTC مع المواد على الجانب التقني للمنتج . يسعدنا مشاركة أفضل ممارساتنا مع المجتمع ، لذلك أقوم بنشر تقريري في شكل مقال.


المقدمة


مثل كل شيء في بداية الرحلة ، بدأنا بمراجعة لكيفية عمل أنظمة التوصيات. والأكثر شعبية هي الهندسة المعمارية من النوع التالي:
صورة


:


  1. , .
  2. c .

:


  • candidate/ — user-product, .
  • candidates extraction/extractor/ — “ ” .

. — ALS. , , . , , . , ALS, baseline’.


, , , realtime , , 30 , , , . , , , , — , .


baseline , ALS . , , :


  • Precision — .
  • Recall — , target .
  • F1-score — F-, .

. 3 :


  • precision@5 — -5 .
  • response-rate@5 — ( 5 ).
  • avg roc-auc per user — roc-auc .

, time-series -, k , test k+1 . / . -, — . , .


, , baseline, ALS .
:
صورة


:
صورة


, . , , , , “ , ”. , , :


  1. .
  2. , .
  3. .
  4. /.
  5. ( ).
  6. , , (Word2Vec, DSSM, etc.).


, . , K ( 1-3 ), K . , :
صورة


, , , recall precision . “ 2 ”.


,


, “ ” , , , - . . , ALS, , . “ ” , , / , , , , , . 2 :
صورة


k — , 14 .
, , .



, - . , //. , - . — , k . , . :
صورة


, , , . :
صورة


2 , :


  1. , , K .
  2. , .

, :
صورة
ft — , K ( K=5)
tm — ,


, (0, 0) recall precision, . , , k , .



— , . -k “” / “” /. “” “” . . , , , . . :
صورة
“category” .


, , , “” .



, — . 2 , [ i]-[ j], j > i, . producti-productj , producti . -k , . :
صورة


:
صورة
, : , , . , , , .


:
صورة
k — , .
, k=4. 4 . 


, ,


— , . 3:


  • ALS
  • Word2Vec (Item2Vec )
  • DSSM

ALS , , . Word2Vec, gensim. , , . , , “” ( ). ecommerce , Ozon. DSSM . Microsoft, , research paper. :
صورة


Q — query, , D[i] — document, -. , . (multilayer perceptron). , .
, , — . :
صورة


— ALS DSSM , Word2Vec . 3 :


  1. , , .
  2. .
  3. TF-IDF .

, , , , . 1, , ½, ⅓, .:
صورة


TF-IDF , TF-IDF , , , , — . , . :
صورة


. ALS:
صورة
Item2Vec :
صورة
, baseline. , k . , , 50-70 .


DSSM:
صورة


?


, , ? ? :


  1. - . , , , .
  2. ?

, : , . , , , “ ” “ ”.


, , : (recall). , , . .
صورة


— , recall — . 2 , :


  • , .
  • .

, «, » , . , “ ” . , . , .


:
صورة
:
صورة


, , . , , , . , . , , :


  1. / .
  2. .
  3. .

, , .  , . . , :


  1. / .
  2. , . , -.
  3. , , .

:
صورة
overall products conversion — , .


. , , , . , , .


, , , , — 3-4%:
صورة


, , realtime , . , .


, . telegram. AI/ telegram — welcome :)


All Articles