🥧 👩🏽‍🍳 👨🏽‍🏭 Juegos de suma cero y condiciones de Karush-Kun-Takker 👧 👶🏾 🗞️

En este artículo, trato el problema de encontrar estrategias mixtas equilibradas usando juegos antagónicos como ejemplo.

Que haya dos jugadores, A y B, que juegan repetidamente un cierto juego. Cada jugador en cada sorteo se adhiere a una de varias estrategias: por simplicidad, asumimos que el número de estrategias para ambos jugadores coincide y es igual $n$ . Al elegir $i$ primer jugador de estrategia y $j$ estrategia del segundo jugador, el primer jugador recibirá una victoria $a_{ij}$ y el segundo jugador tendrá la misma pérdida: así es como se organizan los juegos antagónicos. Estas victorias se pueden escribir como una matriz cuadrada $A$ :

A = ‖ a_{i j} ‖, 1 \leq i, j \leq n

$A = \|a_{ij}\|, 1 \leq i, j \leq n$

Los jugadores juegan el juego repetidamente y pueden usar diferentes estrategias en diferentes sorteos. Una estrategia mixta es un vector de probabilidades asociado con cada una de las estrategias puras del jugador. Cada jugador elige una de las estrategias en el próximo sorteo de acuerdo con la probabilidad definida para ella por su estrategia mixta. Si se denota por $p$ y $q$ estrategias mixtas de jugadores, entonces la expectativa matemática de ganar el primer jugador será

f (p, q) = (A p, q) = \sum_{i = 1}^{n} \sum_{j = 1}^{n} p_{i} q_{j} a_{i j}

$f(p,q) = (Ap, q) = \sum_{i=1}^{n}{\sum_{j=1}^{n}{p_i q_j a_{ij}}}$

Un par de estrategias mixtas se llama equilibrio si ningún jugador puede aumentar sus ganancias cambiando su estrategia. En otras palabras, para cualquier otro par de estrategias. $p'$ , $q'$ realizado:

(A p^{'}, q) \leq (A p, q) \leq (A p, q^{'})

$(Ap', q) \leq (Ap, q) \leq (Ap, q')$

Aquí estamos buscando tales equilibrios.

1. Equilibrio

Entonces, un par de estrategias mixtas forma un equilibrio si un cambio en la estrategia mixta para el primer jugador no puede aumentar sus ganancias, y un cambio en la estrategia mixta para el segundo jugador no puede reducir su pérdida.

Por ejemplo, considere una matriz de pagos de este tipo:

A = (\begin{matrix} 2 & 3 \\ 4 & 1 \end{matrix})

$A = \begin{pmatrix} 2& 3 \\ 4& 1 \end{pmatrix}$

. , , . : (2 3). , , : (4 1). , , : (1 4). , . , , .

. , $(1/2, 1/2)$ , $(1/2, 1/2)$ . 2.5.

, , , . , .

$p$ $q$ , :

p = \arg max_{p^{'}} (A p^{'}, q), q = \arg min_{q^{'}} (A p, q^{'})

$p = \arg \max_{p'}{(Ap', q)}, q = \arg \min_{q'}{(Ap, q')}$

p_{i} \geq 0, q_{j} \geq 0, 1 \leq i, j \leq n

$p_i \geq 0, q_j \geq 0, 1 \leq i,j \leq n$

\sum_{i = 1}^{n} p_{i} = \sum_{j = 1}^{n} q_{j} = 1

$\sum_{i=1}^{n}{p_i} = \sum_{j=1}^{n}{q_j} = 1$

, . - : , .

, , :

A = (\begin{matrix} 3 & 1 & 2 \\ - 2 & 3 & 1 \\ - 2 & - 2 & 3 \end{matrix})

$A = \begin{pmatrix} 3& 1& 2 \\ -2& 3& 1 \\ -2& -2& 3 \end{pmatrix}$

, ,

\sum_{i = 1}^{n} p_{i} = \sum_{j = 1}^{n} q_{j} = 1

$\sum_{i=1}^{n}{p_i}=\sum_{j=1}^{n}{q_j}=1$

p = (0.74, 0, 29, - 0.03)

$p=(0.74, 0,29, -0.03)$

- , . - --.

2. --

-, , 1951- , , 1939- .

m i n_{x \in R} f (x)

$min_{x \in \mathbb{R}}f(x)$

, :

h_{i} (x) \leq 0, 1 \leq i \leq m

$h_i(x) \leq 0, 1 \leq i \leq m$

l_{j} (x) = 0, 1 \leq j \leq r

$l_j(x) = 0, 1 \leq j \leq r$

, , , --:

\frac{\partial}{\partial x} (f (x) - \sum_{i = 1}^{m} λ_{i} h_{i} (x) - \sum_{j = 1}^{r} μ_{j} l_{j} (x)) = 0

$\frac{\partial}{\partial{x}}\Big({f(x)} - \sum_{i=1}^{m}{\lambda_i h_i(x)} - \sum_{j=1}^{r}{\mu_j l_j(x)}\Big) = 0$

λ_{i} \cdot h_{i} (x) = 0, 1 \leq i \leq m

$\lambda_i \cdot h_i(x) = 0, 1 \leq i \leq m$

λ_{i} \geq 0, 1 \leq i \leq m

$\lambda_i \ge 0, 1 \leq i \leq m$

h_{i} (x) \leq 0, 1 \leq i \leq m

$h_i(x) \leq 0, 1 \leq i \leq m$

l_{j} (x) = 0, 1 \leq j \leq r

$l_j(x) = 0, 1 \leq j \leq r$

; .

— . :

$h_i(x) = 0$ ,
- $h_i(x) < 0$ , $\lambda_i=0$ .

, , , . , :

2 $\lambda_i$ ;
2, 1 5 ;
, 3 4;
2 ;
, .

, . .

3.

. , , « ».

$p$ :

$-(Ap, q) \rightarrow \min$
$-p_i \le 0, 1 \leq i \leq n$
$\sum_{j=1}^{n}{p_i} - 1 = 0$

$q$ :

$(Ap, q) \rightarrow \min$
$-q_j \le 0, 1 \leq j \leq n$
$\sum_{j=1}^{n}{q_j} - 1 = 0$

L_{1} (p) = - (A p, q) + \sum_{i = 1}^{n} α_{i} p_{i} - β (\sum_{i = 1}^{n} p_{i} - 1)

$L_1(p) = -(Ap, q) + \sum_{i=1}^{n}{\alpha_i p_i} - \beta \Big(\sum_{i=1}^{n}p_i - 1\Big)$

L_{2} (q) = (A p, q) + \sum_{j = 1}^{n} λ_{j} q_{j} - μ (\sum_{j = 1}^{n} q_{j} - 1)

$L_2(q) = (Ap, q) + \sum_{j=1}^{n}{\lambda_j q_j} - \mu \Big(\sum_{j=1}^{n}q_j - 1\Big)$

\frac{\partial L_{1} (p)}{p_{i}} = - \sum_{j = 1}^{n} a_{i j} q_{j} + α_{i} - β

$\frac{\partial L_1(p)}{p_i} = -\sum_{j=1}^{n}{a_{ij}q_j} + \alpha_i - \beta$

\frac{\partial L_{2} (q)}{q_{j}} = \sum_{i = 1}^{n} a_{i j} p_{i} + λ_{j} - μ

$\frac{\partial L_2(q)}{q_j} = \sum_{i=1}^{n}{a_{ij}p_i} + \lambda_j - \mu$

--, . $p$ :

$\alpha_i \cdot p_i = 0, 1 \leq i \leq n$
$\alpha_i \ge 0, 1 \leq i \leq n$
$\sum_{i=1}^{n}{p_i} = 1$
$p_i \ge 0, 1 \leq i \leq n$

$q$ :

$\lambda_j \cdot q_j = 0, 1 \leq j \leq n$
$\lambda_j \ge 0, 1 \leq j \leq n$
$\sum_{j=1}^{n}{q_j} = 1$
$q_j \ge 0, 1 \leq j \leq n$

, :

\sum_{j = 1}^{n} a_{i j} q_{j} - α_{i} + β = 0, 1 \leq i \leq n

$\sum_{j=1}^{n}{a_{ij}q_j} - \alpha_i + \beta = 0, 1 \le i \le n$

\sum_{i = 1}^{n} a_{i j} p_{i} + λ_{j} - μ = 0, 1 \leq j \leq n

$\sum_{i=1}^{n}{a_{ij}p_i} + \lambda_j - \mu = 0, 1 \le j \le n$

\sum_{i = 1}^{n} p_{i} = 1, \sum_{j = 1}^{n} q_{j} = 1

$\sum_{i=1}^{n}{p_i} = 1, \sum_{j=1}^{n}{q_j} = 1$

$4n +2$ $2n+2$ . :

$\alpha_i \cdot p_i = 0, 1 \leq i \leq n$
$\lambda_j \cdot q_j = 0, 1 \leq j \leq n$

$p_i$ , $\alpha_i$ , $q_j$ , $\lambda_j$ . , $2^{2n}$ $2n$ . $2^{2n}$ , $2n+2$ $2n+2$ ( ).

, --:

α_{i}, p_{i}, λ_{j}, q_{j} \geq 0, 1 \leq i, j \leq n

$\alpha_i, p_i, \lambda_j, q_j \ge 0, 1 \leq i, j \leq n$

, . $i$ :

\sum_{j = 1}^{n} a_{i j} q_{j} - α_{i} + β = 0

$\sum_{j=1}^{n}{a_{ij}q_j} - \alpha_i + \beta = 0$

, $\alpha_i$ ,

\sum_{j = 1}^{n} a_{i j} q_{j} + β = 0

$\sum_{j=1}^{n}{a_{ij}q_j} + \beta = 0$

$\alpha_i$ , $q$ $\beta$ :

α_{i} = \sum_{j = 1}^{n} a_{i j} q_{j} + β

$\alpha_i = \sum_{j=1}^{n}{a_{ij}q_j} + \beta$

, : $A$ . , $\alpha_i$ , $\lambda_j$ : , ; . :

\sum_{j = 1}^{n} a_{i j} q_{j} + β = 0, 1 \leq i \leq n

$\sum_{j=1}^{n}{a_{ij}q_j} + \beta = 0, 1 \le i \le n$

\sum_{i = 1}^{n} a_{i j} p_{i} - μ = 0, 1 \leq j \leq n

$\sum_{i=1}^{n}{a_{ij}p_i} - \mu = 0, 1 \le j \le n$

\sum_{i = 1}^{n} p_{i} = 1, \sum_{j = 1}^{n} q_{j} = 1

$\sum_{i=1}^{n}{p_i} = 1, \sum_{j=1}^{n}{q_j} = 1$

p_{i}, q_{j} \geq 0, 1 \leq i, j \leq n

$p_i, q_j \ge 0, 1 \leq i,j \leq n$

, $n+1$ $n+1$ . .

5.

: , . . , $p$ , $q$ , $p'$ , $q'$ :

(A p^{'}, q) \leq (A p, q) \leq (A p, q^{'})

$(Ap', q) \leq (Ap, q) \leq (Ap, q')$

, , . , . , . : $p_1, q_1; p_2, q_2; ... ; p_k, q_k$ — . $p, q$ ,

\forall i \in 1, . . ., k : (A p_{i}, q) \leq (A p, q) \leq (A p, q_{i})

$\forall i \in {1,...,k}: (Ap_i, q) \leq (Ap, q) \leq (Ap, q_i)$

6.

GitHub: https://github.com/ashagraev/zero_sum_game

matrix.h : , , . . , .

kkt.cpp. . , callback'.

Puede haber más de un equilibrio en un juego; además, puede haber infinitos de ellos. En cualquier caso, debe estar preparado para el hecho de que el algoritmo generará más de una solución (y todo el conjunto de soluciones será un caparazón lineal sobre las soluciones derivadas). Por lo tanto, la firma de la función supone que el resultado es un vector de estrategias, y no una estrategia. Y en general, en consecuencia, se muestran todos estos vectores .

Los ejemplos de matrices de entrada para el programa están en input.txt , y los resultados de ejecutar el programa en estos ejemplos están en el archivo output.txt .

Juegos de suma cero y condiciones de Karush-Kun-Takker

1. Equilibrio

2. --

3.

5.

6.

More articles: