शून्य-राशि का खेल और करुश-कुन-टकर की स्थिति

इस लेख में, मैं एक उदाहरण के रूप में विरोधी खेलों का उपयोग करके संतुलित मिश्रित रणनीतियों को खोजने की समस्या से निपटता हूं।


दो खिलाड़ी ए और बी हों, जो बार-बार एक निश्चित खेल खेलते हैं। प्रत्येक ड्रॉ में प्रत्येक खिलाड़ी कई रणनीतियों में से एक का पालन करता है - सादगी के लिए, हम मानते हैं कि दोनों खिलाड़ियों के लिए रणनीतियों की संख्या मेल खाती है और बराबर होती हैnचुनते समयi पहले खिलाड़ी द्वारा वें रणनीति औरj वें खिलाड़ी द्वारा दूसरी रणनीति, पहले खिलाड़ी को एक जीत मिलेगीaij , और दूसरा खिलाड़ी एक ही नुकसान हो जाएगा - यह कैसे विरोधी खेल व्यवस्थित कर रहे हैं है। इन जीत को एक वर्ग मैट्रिक्स के रूप में लिखा जा सकता हैA :


A=aij,1i,jn


खिलाड़ी बार-बार खेल खेलते हैं और विभिन्न स्वीपस्टेक में विभिन्न रणनीतियों का उपयोग कर सकते हैं। एक मिश्रित रणनीति खिलाड़ी की शुद्ध रणनीतियों में से प्रत्येक से जुड़ी संभावनाओं का एक सदिश है प्रत्येक खिलाड़ी अपनी मिश्रित रणनीति द्वारा उसके लिए परिभाषित संभावना के अनुसार अगले ड्रा में एक रणनीति चुनता है। यदि द्वारा निरूपित किया जाता हैp तथा qखिलाड़ियों की मिश्रित रणनीति, फिर पहले खिलाड़ी के जीतने की गणितीय उम्मीद होगी


f(p,q)=(Ap,q)=i=1nj=1npiqjaij


मिश्रित रणनीतियों की एक जोड़ी को संतुलन कहा जाता है यदि कोई खिलाड़ी अपनी रणनीति को बदलकर अपनी जीत को बढ़ा नहीं सकता है। दूसरे शब्दों में, रणनीतियों की किसी भी अन्य जोड़ी के लिएp, qप्रदर्शन किया:


(Ap,q)(Ap,q)(Ap,q)


यहां अब हम ऐसे संतुलन की तलाश कर रहे हैं।


1. संतुलन


इसलिए, मिश्रित रणनीति की एक जोड़ी एक संतुलन बनाती है यदि पहले खिलाड़ी के लिए मिश्रित रणनीति बदलने से उसकी जीत नहीं बढ़ सकती है, और दूसरे खिलाड़ी के लिए मिश्रित रणनीति बदलने से उसका नुकसान कम नहीं हो सकता है।


उदाहरण के लिए, इस तरह के अदायगी मैट्रिक्स पर विचार करें:


A=(2341)


. , , . : (2 3). , , : (4 1). , , : (1 4). , . , , .


. , (1/2,1/2), (1/2,1/2). 2.5.


, , , . , .


pq, :


p=argmaxp(Ap,q),q=argminq(Ap,q)


:


pi0,qj0,1i,jn


i=1npi=j=1nqj=1


, . - : , .


, , :


A=(312231223)


, ,


i=1npi=j=1nqj=1



p=(0.74,0,29,0.03)


- , . - --.


2. --


-, , 1951- , , 1939- .


:


minxRf(x)


, :


hi(x)0,1im


lj(x)=0,1jr


, , , --:


x(f(x)i=1mλihi(x)j=1rμjlj(x))=0


λihi(x)=0,1im


λi0,1im


hi(x)0,1im


lj(x)=0,1jr


; .


— . :


  • hi(x)=0,
  • - hi(x)<0, λi=0.

, , , . , :


  • 2 λi;
  • 2, 1 5 ;
  • , 3 4;
  • 2 ;
  • , .

, . .


3.


. , , « ».


p:


  • (Ap,q)min
  • pi0,1in
  • j=1npi1=0

q:


  • (Ap,q)min
  • qj0,1jn
  • j=1nqj1=0

:


L1(p)=(Ap,q)+i=1nαipiβ(i=1npi1)


L2(q)=(Ap,q)+j=1nλjqjμ(j=1nqj1)


:


L1(p)pi=j=1naijqj+αiβ


L2(q)qj=i=1naijpi+λjμ


--, . p:


  • αipi=0,1in
  • αi0,1in
  • i=1npi=1
  • pi0,1in

q:


  • λjqj=0,1jn
  • λj0,1jn
  • j=1nqj=1
  • qj0,1jn

, :


j=1naijqjαi+β=0,1in


i=1naijpi+λjμ=0,1jn


i=1npi=1,j=1nqj=1


4n+22n+2. :


  • αipi=0,1in
  • λjqj=0,1jn

pi, αi, qj, λj. , 22n2n. 22n, 2n+22n+2( ).


, --:


αi,pi,λj,qj0,1i,jn


.


, . i:


j=1naijqjαi+β=0


, αi,


j=1naijqj+β=0


αi, qβ:


αi=j=1naijqj+β


, : A. , αi, λj: , ; . :


j=1naijqj+β=0,1in


i=1naijpiμ=0,1jn


i=1npi=1,j=1nqj=1


:


pi,qj0,1i,jn


, n+1n+1. .


5.


: , . . , p, q, p, q:


(Ap,q)(Ap,q)(Ap,q)


, , . , . , . : p1,q1;p2,q2;...;pk,qk— . p,q,


i1,...,k:(Api,q)(Ap,q)(Ap,qi)


6.


GitHub: https://github.com/ashagraev/zero_sum_game


matrix.h : , , . . , .


kkt.cpp. . , callback'.


एक खेल में एक से अधिक संतुलन हो सकते हैं, इसके अलावा, उनमें से कई असीम रूप से हो सकते हैं। किसी भी मामले में, आपको इस तथ्य के लिए तैयार रहने की आवश्यकता है कि एल्गोरिथ्म एक से अधिक समाधान का उत्पादन करेगा (और समाधान का पूरा सेट व्युत्पन्न समाधानों पर कुछ रैखिक शेल होगा)। इसलिए, फ़ंक्शन का हस्ताक्षर मानता है कि परिणाम रणनीतियों का एक वेक्टर है, और एक रणनीति नहीं है। और मुख्य रूप से, तदनुसार, इन सभी वैक्टर को प्रदर्शित किया जाता है


प्रोग्राम के लिए इनपुट मैट्रिसेस के उदाहरण input.txt में हैं , और इन उदाहरणों पर प्रोग्राम को चलाने के परिणाम file.txt में हैं


All Articles