इस लेख में, मैं एक उदाहरण के रूप में विरोधी खेलों का उपयोग करके संतुलित मिश्रित रणनीतियों को खोजने की समस्या से निपटता हूं।
दो खिलाड़ी ए और बी हों, जो बार-बार एक निश्चित खेल खेलते हैं। प्रत्येक ड्रॉ में प्रत्येक खिलाड़ी कई रणनीतियों में से एक का पालन करता है - सादगी के लिए, हम मानते हैं कि दोनों खिलाड़ियों के लिए रणनीतियों की संख्या मेल खाती है और बराबर होती है । चुनते समय पहले खिलाड़ी द्वारा वें रणनीति और वें खिलाड़ी द्वारा दूसरी रणनीति, पहले खिलाड़ी को एक जीत मिलेगी , और दूसरा खिलाड़ी एक ही नुकसान हो जाएगा - यह कैसे विरोधी खेल व्यवस्थित कर रहे हैं है। इन जीत को एक वर्ग मैट्रिक्स के रूप में लिखा जा सकता है :
खिलाड़ी बार-बार खेल खेलते हैं और विभिन्न स्वीपस्टेक में विभिन्न रणनीतियों का उपयोग कर सकते हैं। एक मिश्रित रणनीति खिलाड़ी की शुद्ध रणनीतियों में से प्रत्येक से जुड़ी संभावनाओं का एक सदिश है । प्रत्येक खिलाड़ी अपनी मिश्रित रणनीति द्वारा उसके लिए परिभाषित संभावना के अनुसार अगले ड्रा में एक रणनीति चुनता है। यदि द्वारा निरूपित किया जाता है तथा खिलाड़ियों की मिश्रित रणनीति, फिर पहले खिलाड़ी के जीतने की गणितीय उम्मीद होगी
मिश्रित रणनीतियों की एक जोड़ी को संतुलन कहा जाता है यदि कोई खिलाड़ी अपनी रणनीति को बदलकर अपनी जीत को बढ़ा नहीं सकता है। दूसरे शब्दों में, रणनीतियों की किसी भी अन्य जोड़ी के लिए, प्रदर्शन किया:
यहां अब हम ऐसे संतुलन की तलाश कर रहे हैं।
1. संतुलन
इसलिए, मिश्रित रणनीति की एक जोड़ी एक संतुलन बनाती है यदि पहले खिलाड़ी के लिए मिश्रित रणनीति बदलने से उसकी जीत नहीं बढ़ सकती है, और दूसरे खिलाड़ी के लिए मिश्रित रणनीति बदलने से उसका नुकसान कम नहीं हो सकता है।
उदाहरण के लिए, इस तरह के अदायगी मैट्रिक्स पर विचार करें:
. , , . : (2 3). , , : (4 1). , , : (1 4). , . , , .
. , , . 2.5.
, , , . , .
, :
:
, . - : , .
, , :
, ,
- , . - --.
2. --
-, , 1951- , , 1939- .
:
, :
, , , --:
; .
— . :
, , , . , :
- 2 ;
- 2, 1 5 ;
- , 3 4;
- 2 ;
- , .
, . .
3.
. , , « ».
:
:
:
:
--, . :
:
, :
. :
, , , . , . , ( ).
, --:
.
, . :
, ,
, :
, : . , , : , ; . :
:
, . .
5.
: , . . , , , , :
, , . , . , . : — . ,
6.
GitHub: https://github.com/ashagraev/zero_sum_game
matrix.h : , , . . , .
kkt.cpp. . , callback'.
एक खेल में एक से अधिक संतुलन हो सकते हैं, इसके अलावा, उनमें से कई असीम रूप से हो सकते हैं। किसी भी मामले में, आपको इस तथ्य के लिए तैयार रहने की आवश्यकता है कि एल्गोरिथ्म एक से अधिक समाधान का उत्पादन करेगा (और समाधान का पूरा सेट व्युत्पन्न समाधानों पर कुछ रैखिक शेल होगा)। इसलिए, फ़ंक्शन का हस्ताक्षर मानता है कि परिणाम रणनीतियों का एक वेक्टर है, और एक रणनीति नहीं है। और मुख्य रूप से, तदनुसार, इन सभी वैक्टर को प्रदर्शित किया जाता है ।
प्रोग्राम के लिए इनपुट मैट्रिसेस के उदाहरण input.txt में हैं , और इन उदाहरणों पर प्रोग्राम को चलाने के परिणाम file.txt में हैं ।