في هذه المقالة ، أتعامل مع مشكلة إيجاد إستراتيجيات مختلطة متوازنة باستخدام ألعاب معادية كمثال.
يجب أن يكون هناك لاعبان ، A و B ، يلعبان بشكل متكرر لعبة معينة. يلتزم كل لاعب في كل سحب بإحدى الإستراتيجيات العديدة - من أجل البساطة ، نفترض أن عدد الإستراتيجيات لكل من اللاعبين يتطابق ويتساوى. عند الاختياراستراتيجية اللاعب الأول و استراتيجية اللاعب الثاني ، سيحصل اللاعب الأول على فوز واللاعب الثاني سيحصل على نفس الخسارة - هكذا يتم ترتيب المباريات العدائية. يمكن كتابة هذه الانتصارات كمصفوفة مربعة:
يلعب اللاعبون اللعبة بشكل متكرر ويمكنهم استخدام استراتيجيات مختلفة في مسابقات يانصيب مختلفة. الإستراتيجية المختلطة هي ناقل للاحتمالات المرتبطة بكل من إستراتيجيات اللاعب الخالصة . يختار كل لاعب إحدى الإستراتيجيات في السحب التالي وفقًا للاحتمال المحدد لها من خلال استراتيجيته المختلطة. إذا أشار إليه و إستراتيجيات مختلطة للاعبين ، فإن التوقعات الرياضية للفوز باللاعب الأول ستكون
يسمى زوج من الاستراتيجيات المختلطة التوازن إذا لم يتمكن أي لاعب من زيادة مكاسبه عن طريق تغيير استراتيجيته. وبعبارة أخرى ، لأي زوج آخر من الاستراتيجيات، تم التنفيذ:
هنا نحن نبحث الآن عن مثل هذا التوازن.
1. التوازن
لذلك ، يشكل زوج من الاستراتيجيات المختلطة توازنًا إذا كان تغيير الاستراتيجية المختلطة للاعب الأول لا يمكن أن يزيد من مكاسبه ، ولا يمكن لتغيير الاستراتيجية المختلطة للاعب الثاني أن يقلل من خسارته.
على سبيل المثال ، ضع في اعتبارك مصفوفة الدفع هذه:
. , , . : (2 3). , , : (4 1). , , : (1 4). , . , , .
. , , . 2.5.
, , , . , .
, :
:
, . - : , .
, , :
, ,
- , . - --.
2. --
-, , 1951- , , 1939- .
:
, :
, , , --:
; .
— . :
, , , . , :
- 2 ;
- 2, 1 5 ;
- , 3 4;
- 2 ;
- , .
, . .
3.
. , , « ».
:
:
:
:
--, . :
:
, :
. :
, , , . , . , ( ).
, --:
.
, . :
, ,
, :
, : . , , : , ; . :
:
, . .
5.
: , . . , , , , :
, , . , . , . : — . ,
6.
GitHub: https://github.com/ashagraev/zero_sum_game
matrix.h : , , . . , .
kkt.cpp. . , callback'.
يمكن أن يكون هناك أكثر من توازن واحد في اللعبة ؛ علاوة على ذلك ، يمكن أن يكون هناك الكثير منها بلا حدود. على أي حال ، يجب أن تكون مستعدًا لحقيقة أن الخوارزمية ستنتج أكثر من حل واحد (وستكون المجموعة الكاملة من الحلول عبارة عن غلاف خطي فوق الحلول المشتقة). لذلك ، يفترض توقيع الوظيفة أن النتيجة هي ناقل الاستراتيجيات وليس استراتيجية واحدة. وبشكل رئيسي ، وفقًا لذلك ، يتم عرض جميع هذه المتجهات .
توجد أمثلة لمصفوفات الإدخال للبرنامج في input.txt ، ونتائج تشغيل البرنامج على هذه الأمثلة موجودة في ملف output.txt .