Teoría de Juegos

La teoría de los juegos es una rama de la matemática con aplicaciones a la economía, sociología, biología y psicología, que analiza las interacciones entre individuos que toman decisiones en una marco de incentivos formalizados (juegos). En un juego, varios agentes buscan maximizar su utilidad eligiendo determinados cursos de acción. La utilidad final obtenida por cada individuo depende de los cursos de acción escogidos por el resto de los individuos.

Premio Nobel de Economía 2005 Por contribuciones a la teoría de juegos

La teoría de juegos es una herramienta que ayuda a analizar problemas de optimización interactiva. La teoría de juegos tiene muchas aplicaciones en las ciencias sociales. La mayoría de las situaciones estudiadas por la teoría de juegos implican conflictos de intereses, estrategias y trampas. De particular interés son las situaciones en las que se puede obtener un resultado mejor cuando los agentes cooperan entre sí, que cuando los agentes intentan maximizar sólo su utilidad.

La teoría de juegos fue ideada en primer lugar por John von Neumann. Luego, John Nash, A.W. Tucker y otros hicieron grandes contribuciones a la teoría de juegos.

Juegos

Se denomina juego a la situación interactiva especificada por el conjunto de participantes, los posibles cursos de acción que puede seguir cada participante, y el conjunto de utilidades.

Estrategia

Cuando un jugador tiene en cuenta las reacciones de otros jugadores para realizar su elección, se dice que el jugador tiene una estrategia. Una estrategia es un plan de acciones completo que se lleva a cabo cuando se juega el juego. Se explicita antes de que comience el juego, y prescribe cada decisión que los agentes deben tomar durante el transcurso del juego, dada la información disponible para el agente. La estrategia puede incluir movimientos aleatorios.

Resultados de los juegos

El resultado de un juego es una cierta asignación de utilidades finales. Se denomina resultado de equilibrio si ningún jugador puede mejorar su utilidad unilateralmente dado que los otros jugadores se mantienen en sus estrategias. Un equilibrio estratégico es aquel que se obtiene cuando, dado que cada jugador se mantiene en su estrategia, ningún jugador puede mejorar su utilidad cambiando de estrategia. Alternativamente, un perfil de estrategias conforma un equilibrio si las estrategias conforman la mejor respuesta a las otras.

Forma normal versus forma extensiva de los juegos

En juegos de forma normal, los jugadores mueven simultáneamente. Si el conjunto de estrategias es discreto y finito, el juego puede ser representado por una matriz NxM (ver abajo). Un juego en forma extensiva especifica el orden completo de movimientos a través de la dirección del juego, generalmente en un árbol de juego.

Juegos NxM

Una forma de juegos de dos jugadores, en la cual un jugador tiene N acciones posibles y el otro tiene M acciones posibles. En un juego así, los pares de utilidades o pagos pueden ser representados en una matriz y el juego es fácilmente analizable. Los juegos NxM dan una idea de cómo puede verse la estructura de un juego mas complejo.

Matriz de resultados de un juego

La matriz de resultados de un juego representa el resultado del juego en una matriz. Supongamos que dos personas, A y B, están jugando un sencillo juego. El juego consiste en lo siguiente: la persona A tiene la posibilidad de elegir “arriba” o “abajo”, mientras que B puede elegir “izquierda” o “derecha”. Los resultados del juego se representan en la matriz de resultados:

	Izquierda	Derecha
Arriba	(50 , 100)	(0 , 50)
Abajo	(100 , 50)	(50 , 0)

Estrategia dominante

Una estrategia dominante es aquella elección que realiza el jugador independientemente de lo que haga el otro. En el juego representado en la matriz de arriba, la estrategia dominante para A es elegir “abajo”, mientras que la estrategia dominante para B es elegir “izquierda”. Estas estrategias dominantes dan como resultado el equilibrio de estrategias dominantes del juego. Si cada jugador tiene una estrategia dominante se puede predecir el resultado del juego.

Equilibrio de Nash

El equilibrio de Nash fue formulado por John Nash, que es un matemático norteamericano, en 1951. Un par de estrategias es un equilibrio de Nash si la elección de A es óptima dada la de B y la de B es óptima, dada la de A. El equilibrio de Nash se diferencia del equilibrio de las estrategias dominantes en que, en el equilibrio de las estrategias dominantes, se exige que la estrategia de A sea óptima en el caso de todas las elecciones óptimas de B, y viceversa. El equilibrio de Nash es menos restrictivo que el equilibrio de estrategias óptimas.

Un juego puede tener más de un equilibrio de Nash. Existen juegos en los no existe un equilibrio de Nash.

Dilema del prisionero

Considera la siguiente historia. Dos sospechosos de un crimen son puestos en celdas separadas. Si ambos confiesan, cada uno será sentenciado a tres años de prisión. Si sólo uno confiesa, el que confiese será liberado y usado como testigo contra el otro, quien recibirá una pena de diez años. Si ninguno confiesa, ambos serán condenados por un cargo menor y tendrán que cumplir una pena de sólo un año de prisión. Este juego puede ser representado por una matriz 2x2:

	Sospechoso B confiesa	Sospechoso B no confiesa
Sospechoso A confiesa	(3 , 3)	(0 , 10)
Sospechoso A no confiesa	(10 , 0)	(1 , 1)

Veamos cuál es la estrategia óptima para cada sospechoso. Si B confiesa, A preferirá confesar, ya que si confiesa obtendrá una pena de 3 años, y si no confiesa obtendrá una pena de 10 años. Si B no confiesa, A preferirá confesar, ya que de este modo será liberado, y si no confesara obtendrá una pena de un año. Entonces, A va a confesar, independientemente de lo que haga B. Análogamente, B también va a confesar independientemente de lo que haga A. Es decir, ambos sospechosos van a confesar y obtener entonces una pena de tres años de prisión cada uno. Este es el equilibrio del juego, que es ineficiente en el sentido de Pareto, ya que se puede reducir la condena de ambos si ninguno confesara.

Este es el ejemplo mas famoso de las situaciones en la que los equilibrios competitivos pueden llevar a resultados ineficientes. El dilema del prisionero ilustra la situación que se presenta en los cárteles. En un cártel, las empresas coalicionan (hacen un acuerdo) para reducir su producción y así poder aumentar el precio. Sin embargo, cada empresa tiene incentivos para producir mas de lo que fijaba el acuerdo y de este modo obtener mayores beneficios. Sin embargo, si cada una de las firmas hace lo mismo, el precio va a disminuir, lo que resultará en menores beneficios para cada una de las firmas. La misma estructura de interacciones caracteriza el problema de la provisión de bienes públicos (problema del free rider), y del pago voluntario de impuestos.

Juegos de suma constante

Juegos en los que para cada combinación de estrategias, la suma de los pagos (o utilidades) a cada jugador es la misma. Todas las situaciones de intercambio que no permiten la creación o destrucción de recursos son juegos de suma constante.

Árbol de juegos

El árbol de juegos es una representación de un juego que describe la estructura temporal de un juego en forma extensiva. EL primer movimiento del juego se identifica con un nodo distintivo que se llama la raíz del juego. Una jugada consiste en una cadena conectada de ramas que comienza en la raíz del árbol y termina, si el juego es finito, en el nodo terminal. Los nodos representan los posibles movimientos en el juego. Las ramas que parten de los nodos representan las elecciones o acciones disponibles en cada movimiento. A cada nodo distinto del nodo terminal se le asigna el nombre de un jugador de modo que se sabe quién hace la elección en cada movimiento. Cada nodo terminal informa sobre las consecuencias para cada jugador si el juego termina en ese nodo.

Juego repetido

En un juego repetido un grupo fijo de jugadores juega un juego dado repetidamente, observando el resultado de todas las jugadas pasadas antes que comience la siguiente jugada. La posibilidad de observar las acciones y los resultados pasados antes de que comience la siguiente jugada permite que los jugadores penen o premien las acciones pasadas, de modo que surgen estrategias que no surgirían en los juegos simples no repetidos. Por ejemplo, repitiendo el juego del dilema del prisionero un número suficiente de veces da como resultado un equilibrio en el cual ambos prisioneros nunca confiesan.

Federico Anzil

Abril de 2005

Universidad Nacional de Córdoba – Argentina