dilema del prisionero

Es el “juego” más simple y básico en la teoría de juegos, y es también el ejemplo típico que muestra cómo y por qué el bien social no siempre puede ser favorecido por individuos que actúan en su propio beneficio, y por qué algunos medios externos de coordinación de la conducta pueden ser necesarios para maximizar el bienestar social. La idea es por lo regular atribuida a Melvin Drescher y Merril Flood (1908- ) a partir del trabajo que realizaron en 1950 como parte de la producción de la Corporación Rand sobre la teoría de juegos, mientras que su denominación surgió en un artículo que formalizó el concepto acuñado por el matemático de Princeton, Albert W. Tucker (1905-1995) (Tucker también dirigió la tesis doctoral por la cual John Nash (1928- ) eventualmente ganaría el Premio Nobel de Economía en 1994).

Dos individuos han sido acusados de cometer un crimen juntos, aunque han sido detenidos e interrogados de manera separada. Cada uno entiende que si alguno confiesa mientras el otro no, el confesor testificará en contra del que guarde silencio y saldrá libre, mientras que el prisionero que guarda silencio será condenado a purgar una pena alta. Si ambos guardan silencio, serán condenados sólo por un crimen menor y purgarán una pena menos severa. Si se delatan entre sí, ambos serán condenados a cumplir una pena superior (aunque no tan duradera como la que se les impondría si ninguno hubiera confesado). Estas alternativas son usualmente presentadas en una tabla de cuatro celdas (figura 1).

A pesar de que cada prisionero sabe que la cooperación (esto es, que ninguno se delate) los llevará a un resultado que sería el mejor para ambos (un total de dos años en prisión, en contraste con los 12 o 16 años de los resultados alternos), “no confesar” nunca parece ser la decisión racional individualmente aceptable. Por ejemplo, desde la perspectiva de A: A piensa, “si B me delata, es mejor que yo lo delate (puesto que 8 años en prisión son mejor que 12); si B no me delata, entonces sigue siendo mejor que yo lo delate (puesto que nada es mejor que un año de prisión)”. La perspectiva de B es idéntica. Así, por medio de la toma de decisión de un individuo racional, los dos prisioneros oscilan entre el mejor resultado conjunto (2 años de prisión en total) y el peor resultado conjunto (16 años de prisión en total).

A (confiesa) A (no confiesa)

B (confiesa) (A: 8 años)

(B: 8 años)

(A: 12 años)

(B: 0 años)

B (no confiesa) (A: 0 años)

(B: 12 años)

(A: 1 año)

(B: 1 año)

Figura 1. Dilema del prisionero

El dilema del prisionero es a menudo presentado como una prueba (o al menos una sugerencia metafórica) de que el interés individual llevará a la “traición” y al “engaño” incluso cuando la cooperación actual estuviera dentro de los intereses a largo plazo de los individuos, igual a como ocurre con el interés social. Desde luego, en el ejemplo típico del dilema del prisionero se asume que los prisioneros son culpables, así que a pesar de que sus confesiones no están en sus mejores intereses, sí parecen estar en el interés de su sociedad). Se puede desarrollar una dinámica distinta cuando la cuestión de la traición frente a la cooperación ocurre en un juego repetido (“iterado”). Cuando los mismos jugadores están involucrados en una interacción repetida, varias formas de cooperación (incluyendo un tipo de juego “esto por aquello”, en el que una parte coopera, aunque también responde a una traición con una traición propia) pueden llegar a ser racionales. Esta dinámica tiene sus propias complicaciones (p. ej. ¿qué sucedería cuando pareciera que una repetición del juego del dilema del prisionero estuviese a punto de terminar?), y existe una abundante literatura al respecto.

La “tragedia de los comunes” puede ser considerada como una variante o generalización del dilema del prisionero, que involucra varios participantes. Si hay un área común (de “libre acceso”) de pesca o pastoreo, los intereses a largo plazo de los pastores y pescadores favorecen una limitación modesta hacia todos a fin de mantener la viabilidad del área común. Sin embargo, cada individuo tiene un incentivo para no cooperar, sino más bien para obtener tantos beneficios de los comunes como sea posible, mientras espera a su vez que los otros se restrinjan. Con todos buscando tal incentivo, nadie se limitará y las áreas comunes estarán pronto sobreexplotadas.

David Lewis (1941-2001) demostró (en Philosophy and Public Affairs (1979)) que el dilema del prisionero es, de hecho, una versión de una paradoja de racionalidad menos conocida, el problema de Newcomb. En dicho problema hay dos cajas —una contiene o un millón de dólares o nada, y la segunda contiene mil dólares—. Usted es libre de tomar sólo la primera caja o ambas. El contenido de la primera caja depende de la predicción confiable de sus acciones que realiza con anterioridad otra persona, de modo que la caja contendrá un millón de dólares si la predicción es que usted tomará sólo la primera caja, pero nada si la predicción es que usted tomará ambas. ¿Qué debería hacer? La paradoja es que parece haber buenas razones para cualquier estrategia (tomar sólo una, porque entonces el adivino confiable habrá presentido eso, y puesto un millón de dólares en la caja; o tomar ambas cajas, porque la predicción ya ha ocurrido, y uno sólo puede terminar con lo mismo o más si toma ambas cajas, sin importar cuál sea el contenido de la primera caja). La relación entre el que escoge la caja y el adivino puede considerarse semejante en su estructura a la relación entre los dos prisioneros.

Véase equilibrio de Nash; juegos de coordinación; normas sociales; problema de la acción colectiva; teoría de juegos; tragedia de los anticomunes; tragedia de los comunes

Recurso: Diccionario de teoria jurídica on Buho.Guru