لقد تغلغل التعلم الآلي في حياتنا اليومية. لم يعد البعض يفاجأ عندما يتم إخبارهم عن الشبكات العصبية في هواتفهم الذكية. واحدة من المجالات الكبيرة في هذا العلم هي أنظمة التوصية. إنها في كل مكان: عندما تستمع إلى الموسيقى أو تقرأ الكتب أو تشاهد البرامج التلفزيونية أو مقاطع الفيديو. يتم تطوير هذا العلم في الشركات العملاقة مثل YouTube و Spotify و Netfilx . وبطبيعة الحال، ويتم نشر جميع الإنجازات العلمية في هذا المجال سواء على شهرة NeurIPS أو المؤتمرات ICML ، وفي أقل قليلا معروفة RecSysشحذ هذا الموضوع. وفي هذه المقالة سنتحدث عن كيفية تطور هذا العلم ، وما هي الأساليب المستخدمة في التوصيات بين الحين والآخر ، وما هي الرياضيات وراء كل هذا.

كان مصدر إلهام لي لكتابة هذا المقال من خلال العمل في StatML مختبر في Skoltech المتعلقة بنظم المزكي.
لماذا ولمن هذه المقالة
لماذا يمكن أن يكون هذا مهمًا لكل منا؟ ألق نظرة على القائمة أدناه:
- توصيات الفيديو: YouTube و Netlix و HBO و Amazon Prime و Disney + و Hulu و Okko
- التوصيات الصوتية: Spotify و Yandex.Music و Yandex.Radio و Apple Music
- توصيات المنتج: أمازون ، أفيتو ، لتر ، ماي بوك
- توصيات البحث: Google ، Yandex ، Bing ، Yahoo ، Mail
- : Booking, Twitter, Instagram, ., , GitHub
, . , . , , YouTube.
( ), . , , . , ( ). -, . , -, , - . , . , , , , .
, , , , - . , (, , , ..). , .
, . : — . . , , , , . :
:
, 1 5 ( ) : 1 -1 ( / )
3 :
- Content-based (CB)
- Collaborative filtering (CF)
- Hybrid recommendations

. — , . : — , — , . . , : , ..
, . - , .
. , , , .
, , . . , , . .
Matrix Factorization

, . : . .
- :
- Singular Value Decomposition (SVD)
- Singular Value Decomposition with implicit feedback (SVD++)
- Collaborative Filtering with Temporal Dynamics (TimeSVD++)
- Weighted Matrix Factorization (WMF or ALS)
- Sparse Linear Methods (SLIM)
- Factorization Machines (FM)
- :
- Probabilistic Matrix Factorization (PMF)
- Bayesian Probabilistic Matrix Factorization (BPMF)
- Bayesian Factorization Machines (BFM)
- Gaussian Process Factorization Machines (GPFM)
Singular Value Decomposition (SVD)
— SVD. , , . , . SVD , : . , .
. :
:
, — - . . . :
c :
, , , , . . (GD) (ALS). Habr- , . , , .
( SVD, SVD). , , . . SVD . (bias):
— , — , — . :
SVD++
Factorization Meets the Neighborhood SVD . (explicit and implicit user feedback). , . . : — ( ) — ( ).
SVD++ :
:
, , .. . (item-item recommendation).
Asymmetric-SVD
SVD++ . . :
TimeSVD++
TimeSVD++. (MovieLens, Netflix) , . , . Collaborative Filtering with Temporal Dynamics SVD++ :
دعنا نكتشف كيف يؤثر الوقت بالضبط على كل مصطلح:
انحياز العنصر: إذا قمت بتقسيم الفاصل الزمني عندما تم وضع التقييمات في شرائح (تم اقتراح 30 جزءًا في العمل) وإضافة المعلمات الخاصة بك لكل منتج ، يتم تحديده وفقًا للفاصل الزمني الذي يكون فيه المتغير :
انحياز المستخدم: عند تحليل بيانات Neflix ، لاحظنا أنه لكل مستخدم في المتوسط لا يوجد سوى 40 يومًا يضع فيها التقييمات. لذلك ، سنعمل كما هو الحال مع السلع وإضافة المعلمات الخاصة بنالكل مستخدم. نضيف اعتمادًا خطيًا على الوقت - نقدم مصطلحًا إضافيًا مع نسبة الاستهلاك:
.هناك خيارات أخرى حول كيفية إضافة تبعية زمنية للمستخدمين: يتم وصفه بمزيد من التفصيل في مقالةتضمين المستخدم: سنضيف خدعة مماثلة لكل مكون من تمثيلنا الكامن:
معامل المصفوفة الموزونة (WMF) والمربعات الصغرى البديلة (ALS)
واحدة من المشاكل الرئيسية التي يعاني منها SVD هي استخدام استجابة صريحة فقط من المستخدم. تم حل هذه المشكلة جزئيًا في SVD ++ . ولكن هناك طريقة أخرى - عامل المصفوفة المرجحة ( WMF ). في هذه المقالة ، اقترحوا عدم تغيير النموذج تقريبًا () ، وتغيير عملية التعلم. تعيين للتقييماتالتي لا نعرفها (أي للأزواج ) القيمة 0. ثم لكل زوج أدخل المعلمة , . , . - . YouTube , . , , , . , , , :
: . : . .
, (ALS) . WMF, ALS, .
Fast Alternating Least Squares
ALS , eALS . , . , . .
, ALS :
, .
Sparse Linear Methods (SLIM)
Sparse Linear Methods (SLIM) . , SVD . . SLIM :
. : . :
.
Factorization Machines (FM)
, Factorization Machines (FM). , ( 2- ). :
(SGD) ( ). , . . , — . — ( ). ( ).

, SVD, SVD++ — FM. SVD , :
— . .. . FM :
, : , . , , , , , , . .
Probabilistic Matrix Factorization (PMF)
, , , .
(PMF), . , SVD: — . , :
— , a — (). , , :
( ) , :
— . , SVD , .
Constrained PMF
PMF Constrained PMF. , SVD SVD++. , , :
— , .
Bayesian Probabilistic Matrix Factorization (BPMF)
PMF BPMF. PMF , , . :
- . , .
Bayesian Factorization Machines (BFM)
, Bayesian, . , , - . : . .
Gaussian Process Factorization Machines (GPFM)
GPFM . . , , :
, . , , . , , , .
.
: Bayesian Personalized Ranking (BPR)
BPR , "". , BPR — , , Bayesian Personalized Ranking. . , , . ((+) , (-) ). . . ( personalized ):
— , a — . (MLE), , :
(SGD):
, . , , . SVD:
:
BPR ( ) , . , . . , (pairwise approach) (pointwise approach). . , 5 , . , , . — BPR - , . , .
Show must go on
هذه المرة ناقشنا العديد من التحليل للعوامل الأساليب في أنظمة التوصية، ولكن الرسم البياني و الشبكات العصبية ، التي لديها أيضا الكثير من الأمور المثيرة للاهتمام ، بقي دون تغيير .