Matriu de recompenses

En teoria de jocs, la matriu de pagaments (de vegades també anomenada matriu de recompenses) és una matriu que resumeix la informació donada per les funcions de pagament, en un joc rectangular o en un joc extensiu en la seva forma normal.

Matriu de pagaments per a jocs bipersonals de suma zero

Ja sigui (N, Dj, φj) un joc rectangular, bipersonal i de suma zero (és a dir, aquell en què el guany d'un jugador és igual a la pèrdua de l'altre), si nim denoten la quantitat d'estratègies del jugador 1 i 2 respectivament, llavors la matriu de pagaments del joc, de mida nxm, es defineix d'entrada a entrada com:

a i j = φ 1 ( ( i ) , ( j ) ) {\displaystyle a_{ij}=\varphi _{1}((i),(j))} ,

és a dir, en l'entrada i, j representarà el pagament que resulta per al jugador 1 quan aquest va seguir la seva estratègia i i el jugador 2, per la seva banda, va usar l'estratègia j. Per a aquest tipus de jocs si es coneixen els pagaments del jugador 1 és suficient per saber quins són els pagaments del jugador 2, de manera que la matriu resumeix tota la informació necessària per calcular aquests pagaments.

Exemple

Si es considera el joc pedra, paper o tisora, en què el perdedor ha de pagar una unitat monetària al guanyador i en cas d'empat no hi ha pagament per cap, amb la següent taula es pot considerar una matriu de pagaments per al joc:

Pedra Paper Tisora
Pedra 0 -1 +1
Paper +1 0 -1
Tisora -1 +1 0

Si numerem les estratègies pedra, paper i tisora com 1, 2 i 3 respectivament, la matriu de pagaments serà per definició:

A = ( 0 1 1 1 0 1 1 1 0 ) {\displaystyle \mathbb {A} =\;{\begin{pmatrix}0&-1&1\\1&0&-1\\-1&1&0\\\end{pmatrix}}}

Matriu de pagaments per a jocs bipersonals

En general no és possible saber quin és el pagament per al jugador 2 coneixent només els pagaments del jugador 1. Quan el joc no és de suma zero, una matriu amb entrades unidimensionals no pot mostrar tota la informació sobre els pagaments; per aconseguir-ho és necessari introduir un vector bidimensional (que representarà el pagament per al jugador 1 i 2, respectivament) en cada entrada de la matriu. En fórmules, això vol dir que la matriu de pagaments per a un joc bipersonal en general està donada per:

a i j = ( φ 1 ( ( i ) , ( j ) ) , φ 2 ( ( i ) , ( j ) ) ) {\displaystyle a_{ij}=(\varphi _{1}((i),(j)),\varphi _{2}((i),(j)))} ,

és a dir, respecte de l'entrada i, j serà el vector (a, b) , en què a és el pagament per al jugador 1 i b és el pagament per al jugador 2, quan el jugador 1 tria l'estratègia i i el jugador 2, per la seva banda, tria l'estratègia j .

Exemple

En el joc de pedra paper o tisora es poden canviar els pagaments per fer-ho un joc de suma diferent de zero. El lector d'aquesta entrada ha de suposar ara que una persona externa al joc paga una unitat monetària al guanyador, mentre que el perdedor no paga res. En cas d'empat, cap dels dos guanya res. Si es tornen a numerar les estratègies pedra, paper i tisora amb 1, 2 i 3 respectivament, llavors la matriu de pagaments del joc és donada per:

A = ( ( 0 , 0 ) ( 0 , 1 ) ( 1 , 0 ) ( 1 , 0 ) ( 0 , 0 ) ( 0 , 1 ) ( 0 , 1 ) ( 1 , 0 ) ( 0 , 0 ) ) {\displaystyle \mathbb {A} =\;{\begin{pmatrix}(0,0)&(0,1)&(1,0)\\(1,0)&(0,0)&(0,1)\\(0,1)&(1,0)&(0,0)\\\end{pmatrix}}}

Per descomptat, la matriu de pagaments de qualsevol joc de suma zero es pot expressar de la mateixa manera, però en aquests casos hi haurà informació duplicada. En el primer exemple la matriu de pagament general per a jocs bipersonals resultaria:

A = ( ( 0 , 0 ) ( 1 , 1 ) ( 1 , 1 ) ( 1 , 1 ) ( 0 , 0 ) ( 1 , 1 ) ( 1 , 1 ) ( 1 , 1 ) ( 0 , 0 ) ) {\displaystyle \mathbb {A} =\;{\begin{pmatrix}(0,0)&(-1,1)&(1,-1)\\(1,-1)&(0,0)&(-1,1)\\(-1,1)&(1,-1)&(0,0)\\\end{pmatrix}}}

Cal notar que en ser de suma zero la segona entrada de cada vector és justament l'invers additiu de la primera entrada. Per aquest motiu, per a jocs de suma zero és suficient conèixer només un dels components i que s'elimini l'altre.

Matriu de pagaments per a jocs n-personals

És possible generalitzar el concepte de matriu de pagaments a diversos jugadors. Sigui ( N , D j , φ j ) {\displaystyle (N,D_{j},\varphi _{j})} un joc rectangular, en el qual N és el nombre de jugadors. Sigui n k {\displaystyle n_{k}} el nombre d'estratègies del jugador k. Llavors la matriu de pagaments del joc serà una matriu N-dimensional de mida n 1 x n 2 x . . . x n N {\displaystyle n_{1}xn_{2}x...xn_{N}} i amb entrades en ℝ N {\displaystyle ^{N}} donades per:

a i 1 i 2 . . . i N = ( φ 1 ( I 1 , I 2 , . . . , i N ) , φ 2 ( I 1 , I 2 , . . . , i N ) , . . . , φ N ( I 1 , I 2 , . . . , i N ) ) {\displaystyle a_{i_{1}i_{2}...i_{N}}=(\varphi _{1}(I_{1},I_{2},...,i_{N}),\varphi _{2}(I_{1},I_{2},...,i_{N}),...,\varphi _{N}(I_{1},I_{2},...,i_{N}))}

En aquest cas, el significat intuïtiu de la fórmula és el mateix que en el cas bidimensional. ja que és impossible exemplificar gràficament la matriu de múltiples dimensions.

Matriu de pagaments per a jocs en forma extensiva

Molts dels models de la teoria de jocs no es poden expressar com un joc rectangular i cal plantejar-los com jocs extensius. En aquests casos també hi ha una matriu de pagaments associada al joc, i resulta ser la matriu de pagaments del joc en la seva forma normal.

Matrius de pagaments i equilibris de Nash

Moltes vegades la matriu de pagaments d'un joc és molt útil per calcular els seus equilibris de Nash en estratègies pures. En els jocs bipersonals de suma zero els equilibris de Nash (si existeixen) es troben buscant entrades que siguin punts cadira de la matriu de pagaments. Intuïtivament, un punt cadira d'una matriu és aquella entrada que sigui alhora la menor de la seva línia i la major de la seva columna.

Per al cas de jocs rectangulars bipersonals de suma distinta de zero, els equilibris de Nash se solen trobar per simple inspecció de la matriu recordant la definició d'equilibri de Nash.

Exemples

Pedra, paper o tisora

Cal considerar novament el joc de pedra, paper o tisora en la seva forma de suma zero. En aquest cas el joc no té equilibris de Nash en estratègies pures, ja que la seva matriu de pagaments no té una entrada que sigui simultàniament la menor de la seva línia i la major de la seva columna.

Dilema del presoner

Ara, cal considerar el dilema del presoner, amb dues estratègies cadascun (confessar (1) i no confessar (2) en els dos casos), i pagaments donats per la matriu de pagaments: A = ( ( 6 , 6 ) ( 0 , 10 ) ( 10 , 0 ) ( 2 , 2 ) ) {\displaystyle \mathbb {A} =\;{\begin{pmatrix}(6,6)&(0,10)\\(10,0)&(2,2)\\\end{pmatrix}}}

Les entrades representen el nombre d'anys de presó que rebrà cada pres d'acord amb l'estratègia que hagin triat per separat. És clar que cada pres busca quedar-se el menor temps a la presó, i per tant el seu objectiu és minimitzar els pagaments donats per la matriu. S'observa que el pagament per l'estratègia (confessar, confessar) (representat per l'entrada 2,2 en la matriu) és un equilibri de Nash, ja que cap jugador pot millorar el seu pagament canviant la seva estratègia mentre l'altre mantingui la seva.

Referències

  1. H.S. Bierman, L. Fernández, "Game Theory with Economic Applications", Addison-Wesley, 1993.
  2. K. Binmore, "Teoria de Jocs", McGraw-Hill, 1994.
  3. R. Gibbons, "Un Primer Curs de Teoria de Jocs", Antoni Bosh, 1996.
  4. Zapata L. Paloma, "Economia, Política i Altres Jocs: Una Introducció als Jocs No Cooperatius", les premses de ciències, 2007.
  • Vegeu aquesta plantilla
Articles sobre teoria de jocs
Definicions
Forma normal d'un joc · Forma extensiva d'un joc · Joc cooperatiu · Joc resolt · Matriu de recompenses · Succinct game · Conjunt d'informació · Hierarchy of beliefs · Preference
Conceptes d'equilibri
Equilibri de Nash · Subgame perfection · Mertens-stable equilibrium · Jocs Bayesians · Trembling hand · Proper equilibrium · Epsilon-equilibrium · Correlated equilibrium · Equilibri seqüencial · Quasi-perfect equilibrium · Evolutionarily stable strategy · Risk dominance · Shapley value · Òptim de Pareto · Quantal response equilibrium · Self-confirming equilibrium · Strong Nash equilibrium · Markov perfect equilibrium
Estratègies
Argument de robatori d'estratègia · Estratègia dominant · Estratègia barrejada · Estira i arronsa · Grim trigger · Col·lusió · Backward induction · Forward induction · Markov strategy
Classes de jocs
Joc simètric · Informació perfecta · Simultaneous game · Sequential game · Joc repetitiu · Signaling game · Cheap talk · Joc de suma nul·la · Mechanism design · Problema del regateig · Joc estocàstic · Large poisson game · Nontransitive game · Global games
Jocs
Dilema del presoner · Dilema del viatger · Joc de coordinació · Joc del gallina · Centipede game · Volunteer's dilemma · Dollar auction · Batalla dels sexes · Caça del cérvol · Matching pennies · Ultimatum game · Pedra, paper, tisores · Pirate game · Dictator game · Public goods game · Blotto games · War of attrition · El Farol Bar problem · Cake cutting · Cournot game · Deadlock · Dilema de Diner · Guess 2/3 of the average · Kuhn poker · Nash bargaining game · Screening game · Prisoners and hats puzzle · Trust game · Princess and monster game · Monty Hall problem
Teoremes
Teorema minimax · Nash's theorem · Purification theorem · Folk theorem · Revelation principle · Paradoxa d'Arrow
Persones eminents
Albert W. Tucker · Amos Tversky · Antoine Augustin Cournot · Ariel Rubinstein · Claude Shannon · Daniel Kahneman · David K. Levine · David M. Kreps · Donald B. Gillies · Drew Fudenberg · Émile Borel · Eric Maskin · Harold W. Kuhn · Herbert A. Simon · Herbert Scarf · Hervé Moulin · Jean Tirole · Jean-François Mertens · Jennifer Tour Chayes · John Harsanyi · John Maynard Smith · John Nash · John von Neumann · Julia Robinson · Kenneth Arrow · Kenneth Binmore · Leonid Hurwicz · Lloyd Shapley · Melvin Dresher · Merrill M. Flood · Olga Bondareva · Oskar Morgenstern · Paul Milgrom · Peyton Young · Reinhard Selten · René de Possel · Robert Axelrod · Robert Aumann · Robert B. Wilson · Roger Myerson · Salvador Barberà Sandez · Samuel Bowles · Suzanne Scotchmer · Thomas Schelling · William Vickrey
Altres
All-pay auction · Anàlisis confrontació · Avantatge del primer moviment en escacs · Glossari de la teoria dels jocs · Llista de teòrics dels jocs · Llista de jocs de la teoria dels jocs · Paradoxa de Bertrand · Situació de ningú guanya · Teoria de jocs combinatòria · Teoria evolutiva de jocs · Tragèdia dels comuns · Tirania de les petites decisions