Teoría de Juegos y aplicaciones: El Dilema del Prisionero

Teoría de Juegos y aplicaciones: El Dilema del Prisionero - Page 1
Teoría de Juegos y aplicaciones: El Dilema del Prisionero - Page 2
Teoría de Juegos y aplicaciones: El Dilema del Prisionero - Page 3
Teoría de Juegos y aplicaciones: El Dilema del Prisionero - Page 4
Teoría de Juegos y aplicaciones: El Dilema del Prisionero - Page 5

Esto es sólo una vista previa del documento.

Descargar el documento original para ver más páginas

Descargar

1 de 8

Teoría de Juegos y aplicaciones:


Documentos relacionados


IRC_paper Transcripciones

Teoría de Juegos y aplicaciones: 
 El Dilema del Prisionero 
 
          María de Gracia Blázquez Vallejo           Carmen Virginia Gámez Jiménez 
Ingeniería del Telecomunicación                       Ingeniería de Telecomunicación 
          100025152@alumnos.uc3m.es            100025054@alumnos.uc3m.es 
 
 
ABSTRACT 
En este paper se realiza una introducción a la Teoría de Juegos 
clásica viendo sus orígenes y su evolución y exponiendo algunos 
conceptos básicos. Como caso particular se estudiará el clásico 
problema del Dilema del Prisionero. Se expondrán varias 
aplicaciones de este dilema en situaciones de la vida real y se 
analizarán sus posibles resultados. 
Categories and Subject Descriptors 
H.4.3. [Internet Explorer] 
H.4.1. [Word Office] 
H.3.4. [World Wide Web] 
General Terms 
Teoría 
1. INTRODUCCIÓN 
La importancia de los juegos desde la infancia ha sido destacada 
por los psicólogos como medio de formar la personalidad y de 
aprender de forma experimental a relacionarse con la sociedad y a 
resolver problemas y situaciones conflictivas. [2]  
El estudio de los juegos ha inspirado a científicos de todos los 
tiempos para el desarrollo de modelos matemáticos y teorías. Una 
de las ramas de las matemáticas que surgió de los cálculos para 
diseñar estrategias vencedoras en los juegos de azar fue la 
estadística. Los conceptos propios de la estadística, como 
probabilidad o distribución, tienen aplicación en el análisis de 
juegos de azar o en situaciones en las que hay que tomar 
decisiones y correr riesgos ante componentes aleatorios. 
Pero la teoría de juegos sólo se relaciona lejanamente con la 
estadística. Su objetivo es el estudio de los comportamientos 
estratégicos de los jugadores. En muchas situaciones del mundo 
real, tales como en relaciones políticas, sociales o económicas, 
aparecen escenarios en los que, al igual que ocurre en los juegos, 
el resultado depende de las distintas decisiones de los jugadores.  
La teoría de juegos es una rama de la matemática con aplicaciones 
en economía, biología, sociología y psicología.[4] Examina el 
comportamiento estratégico de jugadores que interactúan y toman 
decisiones en un marco de incentivos formalizados, los juegos, y 
que están motivados por la maximización de la utilidad sabiendo 
que los otros jugadores son racionales. La utilidad final 
conseguida por cada uno de los jugadores depende de las acciones 
escogidas por el resto de los individuos. 
Los juegos analizan matemáticamente situaciones en las que 
aparece un conflicto de intereses. Su objetivo es encontrar las 
opciones óptimas para que se consiga el resultado deseado en las 
circunstancias dadas. 
La teoría de juegos ayuda a analizar problemas de optimización 
interactiva. Tiene muchas aplicaciones en las ciencias sociales. En 
la mayoría de los casos, la teoría de juegos se utiliza en 
situaciones que implican estrategias, conflictos de interés y 
trampas. 
2. ORIGEN 
La teoría de juegos comienza con los trabajos de Zermelo, el cual 
expone que ciertos juegos como el ajedrez son resolubles. En los 
años 20, Borel y Von Neumann analizan los equilibrios de tipo 
minimax para juegos de suma cero (juegos en los que un jugador 
gana lo que pierde su rival).  
 A pesar de ello, el primer avance importante no se produce hasta 
la publicación del libro de Neumman y Morgenstern The Theory 
of Games Behavior (años 40).[3] En este libro se divulgó una 
formalización general de juegos en su forma extendida y normal, 
se introdujo el concepto de estrategia en juegos extensivos y se 
propusieron aplicaciones. 
Un desarrollo importante de estas ideas se produjo en Princeton 
en los años 50 cuando Luce y Raiffa difunden los resultados en su 
libro introductorio, Kuhn expone su definición del concepto de 
información en los juegos, Sharpley define su forma de atacar los 
juegos cooperativos (juegos en los que los jugadores pueden 
establecer contratos para actuar de forma cooperativa) y Nash 
define el llamado ‘equilibrio de Nash’, que permitió extender la 
teoría a juegos no-cooperativos más generales que los de suma 
cero. 
Debido a que en esta época la mayor parte de las aplicaciones de 
los juegos tipo suma-cero iban destinadas a estrategias militares, 
fue el Departamento de Defensa de los EEUU quien financió las 
investigaciones. 
Harsany, en los años 60 y 70, extendió la teoría de juegos a juegos 
de información incompleta (juegos en los que los jugadores no 
conocen todas las características del juego). Selten, ante la 
multiplicidad de equilibrios de Nash, definió el concepto de 
equilibrio perfecto en el subjuego para juegos de información 
completa y una generalización para el caso de juegos de 
información imperfecta 
3. CONCEPTOS FUNDAMENTALES 
3.1 Juego 
En teoría de juegos, la palabra juego se refiere a un tipo especial 
de conflicto en el que toman parte un número de individuos o 
grupos. A estos individuos o grupos se les conoce como los 
jugadores. 
En todo juego hay unas ciertas reglas propias de dicho juego. 
Estas reglas imponen las condiciones para que el juego comience, 
definen las posibles jugadas legales durante las distintas fases del 
juego, el número de jugadas que constituye una partida completa 
y los posibles resultados cuando la partida finaliza (recompensas 
para cada combinación de estrategias). 
3.2 Jugada 
En teoría de juegos, un movimiento o jugada define cómo 
progresa el juego de una fase a otra, desde la posición inicial hasta 
el último movimiento del juego. Las jugadas son el resultado de 
una decisión personal de cada jugador o pueden ser debidas al 
azar. Si son debidas al azar, puede determinarse la probabilidad de 
una cierta jugada.  
Las jugadas de todos los jugadores pueden ser simultáneas o 
pueden ser alternativas entre los distintos jugadores de una 
manera determinada.  
3.3 Ganancia 
El resultado de un juego es una cierta asignación de utilidades 
finales. La ganancia o resultado designa lo que ocurre cuando una 
partida termina. En algunos juegos el resultado consiste en 
declarar un ganador o un perdedor (caso del ajedrez o las damas). 
En otros juegos con apuestas la ganancia está determinada por la 
cantidad que ha apostado cada jugador y por el número de veces 
que un jugador gana a lo largo de la partida (caso del póquer). 
Dentro de los juegos, obtendremos un resultado de equilibrio si 
ninguno de los jugadores puede mejorar su ganancia 
unilateralmente dado que los otros jugadores no modifican sus 
estrategias. 
El resultado de un determinado juego puede representarse 
utilizando una matriz de resultados. En esta matriz se representan 
las posibilidades de cada uno de los jugadores y los resultados del 
juego en función de la opción escogida por cada uno de ellos. La 
forma de representar las posibilidades y resultados de cada uno de 
los jugadores en una matriz de resultados será explicada 
posteriormente. 
3.4 Estrategia 
Una estrategia es una lista con opciones óptimas para cada 
jugador en cualquier momento del juego. Se dice que un jugador 
tiene una estrategia cuando tiene en cuenta las reacciones de otros 
jugadores para realizar su elección. Una estrategia es un plan de 
acciones completo que se lleva a cabo cuando se juega el juego. 
Se explicita antes de que comience el juego, y prescribe cada 
decisión que los agentes deben tomar durante el transcurso del 
juego, dada la información disponible para el agente. La estrategia 
puede incluir movimientos aleatorios.  
3.5 Formas normal y extendida 
A la hora de estudiar los juegos, una de las diferencias más 
importantes es la forma en que estos están representados. Hay dos 
posibilidades: forma normal y extendida.[1] 
3.5.1 Forma normal 
 Un juego está en forma normal cuando la lista de todos los 
posibles resultados de cada jugador, con todas las posibles 
combinaciones de estrategias, viene dada para cualquier secuencia 
de decisiones en el juego. Este tipo de juego no depende de la 
elección de estrategia por parte del jugador. 
En un juego representado en forma normal, se muestran los 
jugadores, las estrategias, y las recompensas en una matriz. Un 
jugador elige las filas y el otro jugador elige las columnas. Cada 
jugador tiene diversas estrategias, que están especificadas por el 
número de filas y el número de columnas. Las recompensas que 
obtienen cada uno de ellos se muestran en el interior de la matriz. 
El primer número del par dado para cada una de las opciones es la 
recompensa recibida por el jugador de las filas y el segundo es la 
recompensa del jugador de las columnas. 
La representación de una matriz de resultados para un juego en su 
forma normal sería la siguiente: 
Tabla 1: Matriz de resultados 
   Opción 1 (jugador B) Opción 2 (jugador B) 
Opción 1 (jugador A) ( A1, B1) (A2,  B2) 
Opción 2 (jugador A) ( A3, B3) ( A4, B4) 
Donde Ai y Bi representan los resultados para cada uno de los 
jugadores según la opción escogida por ambos. 
En juegos representados de esta forma se asume que todos los 
jugadores actúan simultáneamente o, al menos, sin saber la 
elección que toma el otro. Si los jugadores tienen alguna 
información acerca de las elecciones de otros jugadores el juego 
se presenta habitualmente en la forma extensa. 
3.5.2 Forma extendida 
La representación de juegos en forma extensa se encarga de 
juegos con algún orden que se debe considerar. Los juegos se 
presentan como árboles en los que cada vértice o nodo representa 
un punto donde el jugador toma decisiones. El jugador se 
especifica por un número situado junto al vértice. Las líneas que 
parten del vértice representan acciones posibles para el jugador. 
Las recompensas se especifican en las terminaciones de las ramas 
del árbol.  
Un juego en forma extendida se representa de la forma: 
  
Figura 1: Forma extendida 
En la representación anterior se muestra la forma extendida de un 
juego con dos jugadores. El jugador I mueve primero y puede 
elegir entre el movimiento A o B. El jugador II, según el 
movimiento del jugador I elige el movimiento C o D. En función 
de las opciones elegidas por ambos jugadores se llega a los 
posibles resultados R1, R2, R3 o R4. 
En un juego representado en su forma extensa está definido el 
conjunto de reglas que fijan las posibles jugadas en todo 
momento, incluyendo qué jugador tiene que mover, la 
probabilidad de cada una de las opciones si las jugadas se hacen 
de forma aleatoria y el conjunto de resultados finales que 
I 
II 
BA
R1 
R2 R3 R4 
DCDC
II 
relaciona una ganancia con cada una de las posibles formas de 
terminar el juego.  
Además, se asume que cada jugador tiene unas preferencias para 
cada jugada de forma que obtenga la máxima ganancia (o las 
mínimas pérdidas).  
Los juegos representados de esta forma pueden modelar también 
juegos de movimientos simultáneos. En esos casos se dibuja una 
línea punteada o un círculo alrededor de dos vértices diferentes 
para representarlos como parte del mismo conjunto de 
información (por ejemplo, cuando los jugadores no saben en qué 
punto se encuentran). 
La representación en forma normal da al matemático una notación 
sencilla para el estudio de los problemas de equilibrio porque 
desestima la cuestión de cómo las estrategias son calculadas. Para 
tratar esto, es más conveniente usar la forma extensa del juego. 
3.6 Información perfecta 
En un juego se dice que se tiene información perfecta si todos los 
jugadores conocen los movimientos realizados previamente por el 
resto de jugadores. Por lo tanto, sólo pueden ser juegos de 
información perfecta los juegos secuenciales, ya que en los juegos 
simultáneos no todos los jugadores conocen las acciones del resto. 
En teoría de juegos, la mayoría de los juegos estudiados, son de 
información imperfecta. 
3.7 Información completa 
Un juego es de información completa si cada uno de los jugadores 
conoce todas las posibles jugadas. 
No debe confundirse con la información perfecta. En un juego de 
información completa cada jugador tiene que conocer las 
estrategias y recompensas del resto de jugadores, pero no tiene 
porqué conocer las acciones de estos. 
En un juego de información completa cada uno de los jugadores 
tiene la misma información sobre el juego que el resto de los 
jugadores.  
Este tipo de juegos ocurre muy raramente en el mundo real. 
4. TIPOS DE JUEGOS 
Dentro de la teoría de juegos podemos encontrar varias 
clasificaciones de los tipos de juegos que hay, según el número de 
jugadores y las circunstancias del juego. 
4.1 Juegos individuales 
Los juegos en los que interviene un solo jugador no tendrán 
mucho interés desde el punto de vista de la teoría de juegos ya 
que el único interés que interviene es el del propio jugador. No 
hay conflicto de intereses con otro jugador que tome decisiones 
estratégicas independientes del jugador a combatir. 
4.2 Juegos de dos o más jugadores 
Este tipo de juegos son los más estudiados y para la mayoría de 
ellos se conocen las decisiones y resultados. 
Al intentar extender los resultados que se conocen para los juegos 
de dos jugadores a n jugadores aparecen dificultades para 
extender los resultados ya que aparecen nuevas oportunidades 
como la coalición, cooperación y confabulación. 
4.3 Juegos simétricos y asimétricos 
Los juegos simétricos son aquellos en los que los beneficios 
obtenidos por utilizar una estrategia particular sólo dependen del 
resto de las estrategias utilizadas [1], independientemente de qué 
jugador las haya utilizado. De esta forma, las identidades de los 
jugadores podrían intercambiarse sin que esto supusiera una 
modificación en el beneficio obtenido con las estrategias. 
Para los tipos de juegos simétricos podemos encontrar una 
representación estándar: 
Tabla 2: Matriz de un juego simétrico 
 Jugador1 Jugador2 
Jugador1 a,a b,c 
Jugador2 c,b d,d 
En los juegos asimétricos los resultados obtenidos no son 
idénticos desde el punto de vista de cada jugador. Las estrategias 
de cada uno de los jugadores pueden ser iguales o distintas. 
4.4 Juegos de suma nula y suma no nula 
Un juego es de suma nula si al finalizar el juego la suma total de 
los beneficios es cero [1] (total de ganancias = total de pérdidas→ 
se gana exactamente la cantidad que pierde el oponente).  
En los juegos de suma no nula, la ganancia que tiene un jugador 
no tiene por qué coincidir con la pérdida de otro. 
Los juegos de suma nula se estudian mucho más a fondo que los 
de suma no nula en la teoría de juegos ya que Von Neumann y 
Morgenstern demostraron que cualquier juego de n jugadores de 
suma no nula se puede reducir a un juego de n+1 jugadores con 
suma nula, de forma que ese jugador adicional compense con sus 
pérdidas las ganancias netas de los jugadores. 
4.5 Juegos cooperativos 
Estos juegos también se conocen como juegos con transferencia 
de utilidad. En ellos los jugadores pueden comunicarse entre sí y 
negociar un acuerdo. 
En estos juegos hay que analizar las posibilidades de coalición 
que existen y como repartir las ganancias entre los miembros de la 
coalición para que ninguno de ellos esté interesado en romperla. 
4.6 Juegos biestratégicos 
Son juegos en los que cada jugador sólo puede actuar 
seleccionando entre dos posibles estrategias. 
En otros tipos de juegos el jugador puede tener 2 o más estrategias 
para realizar cada jugada. 
4.7 Juegos simultáneos y secuenciales 
Los juegos simultáneos son aquellos en los que los jugadores 
mueven a la vez o desconocen los movimientos anteriores de los 
otros jugadores. 
En los juegos secuenciales los jugadores tienen algún 
conocimiento de las acciones previas. Los jugadores no tienen que 
tener una información perfecta, es suficiente con que tengan algo 
de información. 
En el caso de juegos simultáneos la estrategia debe ser suponer 
cuál es la jugada más conveniente para los jugadores, es decir 
cada jugador debe pensar que haría si estuviera en el lugar del 
otro. Las reglas de actuación en los juegos simultáneos son: 
- Elección de la estrategia dominante. 
- Eliminar la estrategia dominada. 
- Buscar el equilibrio de Nash. Si no hay equilibrio 
lo más apropiado es volverse imprevisible ya que 
cualquier conducta repetitiva puede ser 
aprovechada por los otros jugadores.  
4.8 Juegos con repetición 
Los juegos con repetición son aquellos en los que los jugadores 
juegan a un juego repetidas veces. De esta forma tienen la 
posibilidad de ver los resultados y acciones anteriores y permite 
que los jugadores premien o no las acciones pasadas, surgiendo 
estrategias que no se darían en los juegos simples. 
Por ejemplo, repitiendo el juego del dilema del prisionero un 
número suficiente de veces da como resultado un equilibrio en el 
cual ambos prisioneros nunca confiesan. 
5. APLICACIONES 
Las aplicaciones de la teoría de juegos son muchas y en distintos 
campos como la economía, la biología, la política, la informática, 
la filosofía, en el campo militar,  etc. Debido a este gran número 
de aplicaciones el interés por el estudio de la teoría de juegos va 
en continuo aumento. 
5.1 Economía 
Von Neumann y Morgenstern fueron los primeros en mostrar la 
utilidad de la teoría de juegos para estudiar el comportamiento de 
la economía. 
Gracias a la teoría de juegos se pueden construir modelos que 
representan los mercados financieros en los que pueden aparecer 
distinto número de participantes (compradores y vendedores) y 
variaciones de la oferta y la demanda. Es muy útil para analizar 
los conflictos de intereses entre obtener mayores beneficios e 
incrementar la distribución de bienes y servicios. 
La teoría de juegos ha sido utilizada para analizar distintos 
problemas económicos como oligopolios, duopolios y subastas. 
También se ha utilizado la teoría de juegos para el estudio de la 
división equitativa de propiedades y herencias.  
Otro aspecto de la economía en el que la teoría de juegos también 
sirve de ayuda, es para entender la negociación entre empresas y 
sindicatos. Cada uno parte de sus intereses, normalmente 
contrapuestos, para llegar mediante negociación a un punto 
medio. Ambas partes corren el riesgo de perder si hay ruptura del 
acuerdo, aunque también pueden ganar, lo que supone un 
aumento de producción, beneficios, salarios, etc. 
5.2 Biología 
La teoría de juegos se utilizó por primera vez en este campo para 
explicar la evolución de las proporciones de sexos (mismo 
número de machos que de hembras). Los individuos intentan 
maximizar el número de sus nietos sujetos a la restricción de las 
fuerzas evolutivas, y esto produce como resultado una proporción 
1:1. 
También se ha utilizado la teoría de juegos evolutiva y el 
concepto de estrategia evolutivamente estable para analizar la 
evolución de la comunicación de los animales. Este análisis se ha 
realizado mediante juegos con señales y otros juegos de 
comunicación. 
El problema halcón-paloma se ha utilizado para estudiar la 
conducta combativa y la territorialidad.  Con este problema se 
demuestra lo difícil que es que evolucione un comportamiento 
cooperativo entre individuos no emparentados en una población.  
Normalmente en el campo de la biología las recompensas de los 
juegos se interpretan como adaptación. 
5.3 Política 
La teoría de juegos ha sido utilizada en este campo para explicar 
la teoría de la paz democrática. Según esta teoría habrá 
desconfianza y poca cooperación si alguno de los participantes en 
una disputa es no democrático, ya que en democracia el debate 
público y abierto envía información acerca de las intenciones de 
los gobierno hacia otros Estados. En cambio si hay algún 
participante no democrático será difícil conocer sus intereses, las 
promesas que cumplirá,…  
5.4 Otros campos 
La teoría de juegos es utilizada en otros muchos campos. Por 
ejemplo en la informática se utiliza la teoría de juegos para el 
modelado de programas que interactúan entre sí.  
En sociología se utiliza para el estudio de los problemas que 
aparecen en la toma de decisiones. 
Las estrategias militares también utilizan la teoría de juegos para 
estudiar conflictos de interés. 
En epidemiología ayuda en relación a operaciones de 
inmunización y métodos de prueba de vacunas y otros 
medicamentos. 
6. EL DILEMA DEL PRISIONERO 
La Teoría de juegos se usa para analizar comportamientos 
estratégicos, donde hay dependencia mutua, es decir, donde hay 
que tener en cuenta el posible comportamiento de otros. Un 
ejemplo es el famoso Dilema del Prisionero, que suele atribuirse a 
A.W. Tucker (profesor de Nash). 
El Dilema del Prisionero ha sido profundamente estudiado por la 
Teoría de Juegos, ya que es un modelo de conflictos que ocurren 
frecuentemente en la sociedad.[5] 
El dilema del prisionero se usa como ejemplo del clásico conflicto 
entre intereses individuales y colectivos de quienes toman 
decisiones, y también para justificar los beneficios de la 
colaboración. 
El dilema del prisionero es un ejemplo de un juego de suma no 
nula. En este juego, se supone que cada uno de los jugadores, de 
forma independiente, trata de maximizar su beneficio sin 
importarle el resultado de su adversario.  
A continuación expondremos y analizaremos el problema clásico 
del dilema del prisionero y después analizaremos casos de la vida 
real en los que se encuentran situaciones similares a las dadas en 
este dilema. 
El problema clásico del dilema del prisionero es el siguiente: “la 
policía detiene a dos sospechosos de un delito. No tienen 
suficientes pruebas para condenarlos, por lo tanto, deciden 
interrogarlos por separado. Cada uno de ellos va a ser preguntado 
sobre la culpabilidad del otro. Cada uno de los sospechosos se 
encuentra en una celda, y a ambos se les ofrece el mismo trato: si 
uno confiesa y su cómplice continúa sin hablar, su cómplice será 
condenado a la pena máxima (10 años) y él será puesto en 
libertad. Si el cómplice confiesa, pero él no, recibirá la pena 
máxima y su cómplice será liberado. Si ambos permanecen 
callados, ambos serán encerrados 6 meses por un cargo menor, 
mientras que si ambos confiesan, serán condenados a 6 años.“ 
Cada preso puede optar por “Colaborar” con el otro, asegurando 
que el compañero se encuentra injustificadamente en la cárcel, o 
“Defraudar”, acusándole de haber realizado el delito. 
La matriz que representa las opciones de este juego y sus posibles 
resultados es la siguiente: 
 
Tabla 3: Matriz dilema del prisionero 
   
Sospechoso B lo 
niega 
Sospechoso B 
confiesa 
Sospechoso A lo 
niega 
Ambos son 
condenados a 
6 meses 
A es condenado a 10 
años 
B queda libre 
Sospechoso A 
confiesa 
A queda libre 
B es condenado a 10 
años 
Ambos son 
condenados a  
6 años 
Vamos a analizar cada una de las opciones posibles y los 
consecuentes resultados. 
En primer lugar suponemos que la única meta de ambos 
sospechosos es minimizar su pena, es decir, ambos sospechosos 
son completamente egoístas. 
 Cada sospechoso tiene dos opciones: cooperar con su cómplice y 
permanecer callado o traicionar a su cómplice y confesar. El 
resultado de cada elección depende de la elección del cómplice, 
por lo tanto, podrían esperar a saber su elección para realizar la 
suya. El problema es que no pueden saber la opción elegida por 
éste, es decir, cada uno de los sospechosos debe elegir una opción 
sin saber qué ha elegido su cómplice. Incluso si fueran capaces de 
hablar entre ellos, tampoco pueden estar seguros de poder confiar 
el uno en el otro. 
Si uno de ellos confía en que el cómplice va a cooperar y va a 
permanecer en silencio, la opción más egoísta (opción óptima) 
sería confesar, ya que de esta manera saldría libre y su cómplice 
tendría que cumplir la pena máxima. Sin embargo, si espera que 
el cómplice confiese, la mejor opción es confesar también y así 
evitar la pena máxima. En este caso ambos cumplirían la misma 
pena de 6 años. Si ambos deciden cooperar, cumplirían la pena 
mínima. 
Como hemos podido ver, confesar es una estrategia dominante 
para ambos jugadores, ya que, sea cual sea la elección del 
cómplice, siempre se reducirá la pena al confesar. Sin embargo, 
este resultado no es óptimo, ya que si ambos confiesan reciben 
una condena larga. Aquí se encuentra el punto clave del dilema 
del prisionero.  
Desde el punto de vista del interés óptimo del conjunto de los dos 
sospechosos, la elección que lleva al mejor resultado es que 
ambos prisioneros cooperen, ya que de esta forma ambos cumplen 
la mínima pena posible. Este es el resultado óptimo del grupo, y 
cualquier otra decisión empeoraría el resultado del conjunto. Sin 
embargo, si los jugadores siguen intereses individuales y egoístas, 
ambos recibirán una sentencia larga. 
Existe otra versión del dilema del prisionero (dilema del 
prisionero iterativo) en la que es posible castigar al cómplice si él 
te ha traicionado. En este juego es posible llegar a un resultado 
cooperativo.  
En el dilema del prisionero iterado, los jugadores deben escoger 
su estrategia una y otra vez, y tienen memoria de sus encuentros 
previos, es decir, recuerdan la estrategia que ha seguido cada 
jugador en la jugada anterior. Al estudiar los resultados que se 
obtienen se observó que las estrategias egoístas tendían a ser 
peores a largo plazo, mientras que las estrategias de colaboración 
tendían a ser mejores (viéndolo respecto al interés propio). 
La estrategia dominante en el caso del dilema del prisionero 
iterado es “Tit for Tat”. Esta estrategia consiste en cooperar en la 
primera iteración, y después elegir la estrategia que el oponente 
eligió en la jugada anterior. 
7. EJEMPLOS DE APLICACIÓN DEL 
DILEMA DEL PRISIONERO EN LA VIDA 
REAL 
En la vida real tenemos muchos ejemplos de interacciones 
humanas y de interacciones naturales en las que se obtiene la 
misma matriz de resultados que en el dilema del prisionero. Por 
ello, el dilema del prisionero ha sido estudiado profundamente por 
la Teoría de Juegos. 
Vamos a ver ejemplos donde encontramos situaciones similares a 
las estudiadas en el dilema del prisionero y a analizar las posibles 
opciones y resultados del juego. 
7.1 Dilema del prisionero en la docencia 
Un profesor al comienzo del curso propone un método de 
evaluación distinto al clásico de realizar un examen final al 
terminar el curso. Es beneficioso para los alumnos no tener que 
hacer un examen final, ya que en esa época tienen muchos 
exámenes y poco tiempo para estudiar todas las asignaturas. 
Este método consiste en la realización de una evaluación continua 
mediante la realización y entrega de ejercicios en grupos. Si la 
mayoría de los ejercicios están bien, no habrá examen final. Pero 
si los alumnos no se esfuerzan y los ejercicios no son buenos 
tendrán que hacer un examen al final de curso. 
Los alumnos deberán entregar ejercicios semanalmente. 
Consideraremos que los alumnos han trabajado cuando a lo largo 
de toda la evaluación continua, la media de los alumnos que han 
realizado bien los ejercicios es superior o igual al 80%. De esta 
forma, habrá semanas en las que entreguen los ejercicios muchos 
grupos y otras en las que sólo los entreguen unos pocos. Lo 
importante es que al final del cuatrimestre, la media de las 
entregas de todas las semanas supere el 80%. 
La matriz que representa las posibles opciones de los alumnos y 
los consecuentes resultados se muestra en la Tabla 4. 
Tabla 4: Matriz método de evaluación 
 80% se esfuerza 
80% no se 
esfuerza 
20% se esfuerza 
Nadie hace 
examen final 
habiendo 
trabajado todos 
Todos tienen que 
hacer examen 
final, hay una 
minoría que ha 
trabajado 
20% no se 
esfuerza 
 
Nadie hace 
examen final pero 
la mayoría ha 
trabajado 
 
Todos tienen que 
hacer el examen 
final, sin haber 
trabajado 
Los alumnos tienen dos opciones ante este método de evaluación: 
pueden decidir todos esforzarse y hacer bien los ejercicios para 
librarse del examen final, o pueden “traicionar” a sus compañeros 
y no esforzarse, dependiendo de esta forma su suerte de lo que 
hagan sus compañeros.  
Normalmente los alumnos intentarán aprobar la asignatura 
realizando el mínimo esfuerzo y pensarán que el resto de 
compañeros sí se esforzará para librarse del examen, 
beneficiándose de ello. El problema es que no se sabe si el resto 
se esforzará o todos pensarán lo mismo. 
Para ver las posibilidades, consideraremos uno de los grupos de la 
clase, que denominaremos grupo A. El grupo A puede pensar que 
todos los demás grupos decidirán esforzarse para librarse del 
examen, entonces para ese grupo la opción óptima sería no 
esforzarse. Serían los únicos que no entregarían unos buenos 
ejercicios, pero como los de todos los demás están bien, se 
librarían de hacer examen y aprobarían fácilmente, mientras que 
el resto de grupos ha tenido que trabajar durante todo el curso. 
Si por el contrario, el grupo A piensa que el resto de grupos no se 
va a esforzar, lo mejor para ellos sería no esforzarse tampoco, ya 
que tendrían que hacer examen final, pero por lo menos no habrán 
trabajado durante el curso. 
Si todos los grupos deciden esforzarse y trabajar para entregar 
unos buenos ejercicios no tendrán que hacer examen final, y todos 
habrán trabajado durante el curso. 
Para todos los grupos el no esforzarse sería una estrategia 
dominante. Sea cual sea la estrategia del resto de grupos siempre 
consiguen no trabajar durante el curso. El problema es que esa 
estrategia no lleva a un resultado óptimo ya que si ninguno se 
esfuerza, no habrán trabajado durante el curso  pero tendrán que 
hacer un examen final. 
Si todos los grupos piensan en el interés general, lo mejor sería 
que todos se esforzaran para no tener que hacer el examen final. 
Por lo tanto, al igual que en caso del dilema del prisionero, vemos 
que la estrategia dominante no lleva a una solución óptima, ya que 
el interés propio de cada uno de los grupos les lleva a este 
resultado. 
Otro ejemplo mucho más claro en el que se puede aplicar el 
dilema del prisionero es cuando un profesor descubre a dos 
alumnos copiando, aunque no puede demostrarlo. 
Durante un examen parcial el profesor ve que dos alumnos están 
hablando, por lo que supone que están copiando, aunque no está 
seguro del todo. Para descubrir si estaban copiando habla con 
cada uno de los alumnos por separado y les dice que, si confiesan 
y el otro lo niega, corregirá su examen y no sufrirán castigo, 
mientras que el otro irá directamente a septiembre. Si lo niegan, 
pero su compañero confiesa, tendrá que ir a septiembre, mientras 
que su compañero se librará. Si los dos permanecen callados, lo 
único que les pasará es que tendrán que hacer un trabajo. Sin 
embargo, si ambos alumnos confiesan tendrán que repetir el 
examen.  
Tabla 5: Matriz copiar 
 
Alumno A lo 
niega 
Alumno A 
confiesa 
Alumno B lo 
niega 
Ambos tienen que 
hacer un trabajo 
A no sufre castigo. 
B va directamente 
a septiembre 
Alumno B 
confiesa 
A va directamente 
a septiembre. B no 
sufre castigo 
Ambos tienen que 
repetir el examen 
Vamos a analizar igual que hemos hecho en el ejemplo anterior 
las distintas estrategias que puede seguir cada uno de los alumnos, 
y las consecuencias que éstas tienen. 
Supondremos que ambos alumnos siguen una estrategia egoísta, 
es decir, sólo les interesa su propio beneficio. Vemos entonces las 
posibilidades de uno de los alumnos. Uno de los alumnos puede 
pensar que su compañero no le va a traicionar, por lo tanto, si él 
confiesa, se libra del castigo. Actúa de forma egoísta, ya que actúa 
pensando sólo en su beneficio. Si confiesa él se librará del castigo 
mientras que su compañero suspende el examen y tiene que 
hacerlo en septiembre.  
Sin embargo, si este alumno piensa que su compañero va a 
confesar para intentar librarse del castigo, la mejor opción es 
confesar también. De esta forma se evita ir directamente al 
examen de septiembre ya que tiene la opción de repetir el examen. 
Vemos como, al igual que en el ejemplo anterior, al actuar 
siguiendo una estrategia egoísta no se consigue el resultado 
óptimo. En este ejemplo, el resultado óptimo sería que ambos 
estudiantes decidiesen no traicionar a su compañero y de esta 
forma sólo tendrían que hacer un trabajo. Sin embargo, la 
estrategia dominante es el confesar, y esto les lleva a un resultado 
en el que tienen que trabajar más, ya sea repetir el examen ahora o 
ir directamente a septiembre. 
Si los estudiantes hubieran actuado buscando el beneficio del 
grupo en lugar de su propio beneficio, hubieran llegado a un 
resultado óptimo. 
7.2 Ciclismo 
Otro ejemplo de un escenario similar al planteado en el dilema del 
prisionero ocurre a menudo en las carreras de ciclismo.[1] 
Supongamos el caso de dos ciclistas, que a mitad de la carrera, se 
encuentran alejados del pelotón. El problema de ir alejados del 
pelotón es, que al estar en una posición delantera, no pueden 
refugiarse del viento. Normalmente ambos ciclistas compartirán la 
pesada carga de esta posición. Si ninguno de ellos hace un 
esfuerzo para permanecer delante, el pelotón les alcanzará 
rápidamente, perdiendo ambos la posibilidad de obtener ventaja 
en la carrera. Si uno de los ciclistas hace todo el trabajo y 
mantiene a ambos alejados del pelotón, posiblemente esto llevará 
a una victoria del segundo ciclista que ha tenido una carrera fácil 
gracias al otro corredor y podrá obtener una mayor ventaja. Si 
ambos ciclistas realizan un esfuerzo por permanecer delante, 
ambos se cansarán. En este caso es posible que uno de ellos gane 
la carrera o simplemente que ambos estén muy cansados y sean 
alcanzados por el resto del pelotón. 
Esto suele ocurrir muy a menudo en las grandes carreras ciclistas, 
en las que corredores de un mismo equipo se sacrifican en 
beneficio del equipo, ya que uno de los ciclistas hace el esfuerzo 
para que otro corredor con mayores posibilidades gane la carrera. 
Tabla 6: Matriz ciclismo 
 
Ciclista A no hace 
el esfuerzo 
Ciclista A hace el 
esfuerzo 
Ciclista B no hace 
el esfuerzo 
Ambos son 
alcanzados por el 
pelotón 
B puede ganar la 
carrera 
Ciclista B hace el 
esfuerzo 
A puede ganar la 
carrera 
Ambos se 
cansarán 
 
Si los ciclistas actúan buscando su propio beneficio, el resultado 
será peor, ya que de esta forma no obtendrán ventaja. La 
estrategia óptima sería buscar el beneficio del grupo. 
7.3 Ciencia política 
Otro ejemplo del dilema del prisionero podemos encontrarle en 
ciencias políticas. En este campo encontramos el escenario del 
dilema del prisionero cuando tenemos dos estados involucrados 
en una carrera de armas. 
Las opciones de ambos estados son: incrementar el gasto militar 
en armas para estar preparados para un conflicto, disponiendo en 
este caso de menos presupuesto para otras cosas, o llegar a un 
acuerdo con el otro estado para reducir el armamento y poder 
invertir ambos más dinero en investigación u otras cosas. 
 Si llegan a un acuerdo para reducir las armas ninguno de los dos 
estados estará seguro de que el otro cumplirá el trato, por lo tanto, 
ambos estados comprarán más armas para estar más preparados 
en caso de tener que enfrentarse a un conflicto. 
 Ambos estados parecen actuar racionalmente, pero el resultado es 
irracional, ya que ambos gastarán más dinero en armamento 
innecesario.  
 La matriz que representa las opciones de ambos estados junto con 
los resultados se muestra en la Tabla 7. 
Tabla 7: Matriz compra armas 
 
Estado A reduce 
su armamento 
Estado A compra 
más armas 
Estado B reduce 
su armamento 
Ambos pueden 
dedicar el dinero a 
otras cosas 
A está más 
preparado en caso 
de un conflicto 
Estado B compra 
más armas 
B está más 
preparado en caso 
de un conflicto 
Ambos malgastan 
el dinero en armas 
En este caso, al igual que en los demás ejemplos mostrados, el 
resultado óptimo se obtiene cuando se busca el beneficio del 
grupo y no el beneficio particular. Sin embargo, en una situación 
como la planteada, es difícil que se consiga la cooperación entre 
los estados. 
7.4 Duopolio 
En una situación de oligopolio, los resultados de una empresa 
dependen de las decisiones de las empresas competidoras, y no 
solamente de su decisión. Esta situación de las empresas es otro 
ejemplo de una situación similar a la encontrada en el Dilema del 
prisionero.[2] 
Supongamos que dos empresas A y B forman un duopolio en el 
sector textil. En la época de las rebajas, ambas empresas 
normalmente invierten grandes cantidades en publicidad. Esta 
inversión es tan alta que suele implicar la pérdida de todo el 
beneficio obtenido con las rebajas. Dado que sólo hay dos 
empresas, estas se ponen de acuerdo y deciden no invertir en 
publicidad para obtener todo el beneficio que generen las ventas. 
Sin embargo, si una de las dos empresas rompe el acuerdo y lanza 
una campaña publicitaria en el último momento, conseguirá atraer 
a todos los consumidores, por lo que sus beneficios serán mucho 
mayores, mientras que la empresa competidora perderá dinero. 
Las opciones de cada una de las empresas y los posibles 
resultados pueden agruparse en una matriz de pagos similar a las 
explicadas anteriormente. Al igual que en casos anteriores, cada 
empresa tiene que elegir entre dos estrategias: respetar el acuerdo 
o traicionar a la otra empresa e invertir en publicidad. 
Si una de las empresas, por ejemplo la empresa A, piensa que B le 
va a traicionar y va a invertir en publicidad, ella también debería 
invertir ya que de esta forma no obtiene beneficios pero tampoco 
pérdidas. Si de lo contrario piensa que la empresa B no le va a 
traicionar, A piensa que a ella le conviene traicionar el acuerdo, 
ya que de esta manera obtendrá unos beneficios muy altos. Sea 
cual sea la estrategia de la empresa competidora, lo que más le 
conviene a la empresa A es traicionar el acuerdo. Esta misma será 
la conclusión a la que llegue la empresa B. Por lo tanto, ambas 
empresas se traicionarán y obtendrán resultados peores que si 
hubieran mantenido el acuerdo. 
Vemos de nuevo como en estos casos, los agentes actúan 
buscando su propio interés, sin embargo, de esta forma no 
obtienen un resultado óptimo. 
7.5 Trabajo en equipo 
Suponemos un caso al que se enfrenta un equipo de desarrollo de 
software, en el que hay peligro de que algunos miembros pierdan 
su puesto si el proyecto fracasa.[6] 
Lo más normal en un trabajo que se debe realizar en equipo es 
que todos compartan su conocimiento para que así el proyecto 
tenga más posibilidades de tener éxito, y será más probable que 
todos mantengan su puesto de trabajo. El problema es que cuando 
uno comparte su conocimiento, no puede estar seguro de que el 
resto también lo hará. Los programadores también tienen la 
opción de ocultar su conocimiento para destacar y asegurar su 
permanencia en la empresa, pero si todos se comportasen así 
aparecerían problemas como tareas repetidas, errores repetidos,… 
lo que puede provocar que ningún miembro del equipo conserve 
su puesto de trabajo. 
El objetivo de cada programador es no perder su puesto de 
trabajo. Podrá optar por dos estrategias, no compartir el 
conocimiento y tratar que sea otro el que sea expulsado, o 
compartirlo para que nadie sea expulsado. 
Un programador puede plantearse que si nadie coopera, no es 
necesario que él coopere ya que el proyecto fracasará de todas 
formas ya que nadie compartirá sus conocimientos y el proyecto 
no avanzará. Si el programador piensa que todo el mundo va a 
aportar nuevas ideas al proyecto, puede decidir no compartir sus 
conocimientos, ya que en un equipo grande no es muy influyente 
la propuesta de una sola persona. De esta forma ocultará sus 
conocimientos y podrá destacar y permanecer en la empresa. Sin 
embargo, si todos aportan sus conocimientos el proyecto tendrá 
éxito y todos se asegurarán su permanencia en la empresa. 
La estrategia dominante es el no compartir los conocimientos para 
asegurar la permanencia en la empresa, pero de esta forma se 
corre el riego de que el proyecto fracase. Si los programadores 
buscan su propio beneficio seguirán esta estrategia, que no es la 
óptima. Sin embargo, si todos deciden aportar sus conocimientos 
obtendrían el resultado óptimo ya que el proyecto saldrían 
adelante y todos permanecerían en la empresa. 
 7.6 Bienes Comunes 
En una aldea en la que el medio de subsistencia es la ganadería, 
cada familia tiene su ganado, pero los pastos en los que se 
alimentan son un bien común. En este escenario de nuevo 
podemos aplicar el dilema del prisionero para estudiar el 
comportamiento de los habitantes de la aldea.[7] 
Cada familia tiene dos estrategias posibles, cuidar los pastos o no 
cuidarlos: 
Tabla 8: Matriz actuación familias 
mi familia  
cuidarlos no cuidarlos 
cuidarlos  2,2 4,1 Resto de 
familias 
no cuidarlos 1,4 3,3 
Lo más normal es que al utilizar pastos comunes, ninguna familia 
se vea estimulada a cuidar los pastos para procurar que no se 
agoten o estropeen. Su estrategia preferida será no cuidar los 
pastos, esperando que los demás si que los cuiden. 
La siguiente estrategia que seguirían las familias por orden de 
preferencia sería que todos cuidasen los pastos. Después iría la 
estrategia de que ninguno cuidase lo pastos, siendo la estrategia 
menos preferida aquella en la que una familia cuida los pastos y el 
resto no. 
La estrategia dominante para cada familia es no cuidar los pastos, 
independientemente de lo que hagan los demás. Esto lleva a un 
resultado que es peor que si todas fueran cuidadosas, pero es lo 
que suele ocurrir con las propiedades comunes. 
Estudios en economía señalan que una posible solución a este 
problema sería dividir los pastos en parcelas, asignando una a 
cada familia, que deberá ocuparse de ella ya que pasa a ser una 
propiedad privada. Otra solución sería que las autoridades 
regulasen el uso de los pastos. 
8. CONCLUSIONES 
A través de distintos ejemplos de aplicaciones del Dilema del 
Prisionero hemos podido observar cómo influye la Teoría de 
Juegos en muchas situaciones que se dan en la vida cotidiana. 
Este es el motivo por el que la Teoría de Juegos ha sido 
ampliamente estudiada a lo largo de la historia. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
En particular, hemos visto cómo los problemas que presentan 
situaciones similares a las planteadas por el Dilema del 
Prisionero, siempre obtendrían un resultado óptimo si los 
jugadores buscaran el beneficio del grupo, y no el beneficio 
propio. Sin embargo, en la mayoría de estas situaciones, siempre 
se obtiene un resultado subóptimo, ya que los jugadores actúan de 
una forma egoísta, perjudicando a su contrincante, pero al mismo 
tiempo perjudicándose a él mismo. 
9. REFERENCIAS 
[1] Teoría de juegos 
      http://es.wikipedia.org/wiki/ 
      visitado el 6/11/06 
 
[2] Introducción a la Teoría de Juegos 
     http://www.eumed.net/cursecon/juegos/index.htm 
     visitado el 8/11/06 
 
[3] Teoría de Juegos 
      http://www.monografias.com 
      visitado el 8/11/06 
 
[4] Teoría de Juegos 
     http://www.econlink.com.ar/definicion/teoriadejuegos.shtml 
     visitado el 8/11/06 
 
[5] El Dilema del Prisionero 
      http://www.eumed.net/cursecon/juegos/presos.htm 
      visitado el 20/11/06 
 
[6] Introducción al Dilema del Prisionero 
    http://www.redcientifica.com/gaia/dp/pris_c.htm 
    visitado el 20/11/06 
 
[7] La Tragedia de los comunes y el origen del derecho 
http://w3.cnice.mec.es/recursos/bachillerato/economia/9/        
comunes.htm 
     visitado el 5/12/06 
 

© 2016 - 2017 Docmia. Todos los derechos reservados.