jueves, 2 de febrero de 2012

Dos paradojas y la racionalidad en juegos



El tema de la racionalidad es frecuentemente usado cuando hacemos alusión al tipo de comportamiento esperado por parte de los agentes que participan en una situación de conflicto como la que nos presenta la Teoría de Juegos. Y aunque dicho concepto pueda ser diferente en otros campos como el de la psicología o  la filosofía, para los juegos el comportamiento racional tiene que ver con las conductas mediante las cuales una persona o agente  tiende a mejorar sus intereses de acuerdo a la información que dispone.

Sin embargo, el imperativo de procurar a toda costa el mayor bienestar, o bien, el de actuar racionalmente, no siempre ha llevado a la mejor situación a todos los participantes involucrados. El ejemplo paradigmatico de esto lo ofrece el famoso Dilema del prisionero propuesto por Tucker, donde la inclinación por la estrategia Egoísta no les permite conseguir a los participantes  su mejor pago.



J2
Denunciar
No denunciar
J1

Denunciar
(-10,-10)
(0,-20)
No denunciar
(-20,0)
(-2,-2)

 

En el contexto de la toma de decisiones, es de vital importancia preguntarse por la consistencia lógica de los procesos mediante los cuáles una colectividad trata de encontrar la alternativa que mejor satisfaga los intereses de grupo, como es el caso de una elección democrática. Lograr, por ejemplo, el diseño de un sistema de votación que refleje  el "sentir de las mayorías", y que ésta sea a la vez consistente con la gama de preferencias existentes durante una elección es de hecho un asunto bastante problemático y al que ya se le ha diagnosticado un destino poco favorable.
En 1951, con su famoso teorema "de imposibilidad", el Premio Nobel de Economía Kenneth Arrow daba a entender que no podía hacerse una generalización a partir de las preferencias individuales de un grupo de individuos participando en una toma de decisiones, sin que esto violara en alguna medida determinados "criterios racionales" o "buenos principios" identificados con los procesos de elección. Algún tiempo atrás (siglo XVIII), investigado acerca del número óptimo de jurados en la Revolución francesa, Antoine Caritat Condorcet ya había encontrado una situación un tanto paradójica, la cual puede enunciarse de la siguiente manera: 
"De la transitividad en las preferencias individuales en una votación por mayoría simple, no tiene por qué seguirse la transitividad en las preferencias colectivas"

La paradoja de Condorcet.

Traslademos a nuestro contexto el caso analizado por el analista Horacio Piffano en las elecciones de 2003 en Argentina. Supongamos que en un determinado momento existe un conjunto C de candidatos elegibles para nuestro país, digamos C= {López Obrador, Peña Nieto y Santiago Creel}, y que decidimos construir una relación binaria llamada relación de preferencias (C,≤ ) para el electorado, la cuál queremos que sea  reflexiva, transitiva y completa, es decir:

 i) ∀ a∈C, a ≤ a (cada candidato es preferible que sí mismo)

ii) a,b,c ∈C,a ≤ b y b ≤ c,entonces a ≤ c (Si el candidato b es preferible sobre a, pero c es preferible sobre b, entonces el candidato c se prefiere por encima de a)

iii) ∀ a,b ∈ C,se cumple que a ≤ b  o b ≤ a (Dados dos candidatos, siempre se puede saber cuál tiene la preferencia del electorado)


Ahora pensemos que existen tres sectores en el electorado:

X:Obradoristas anti-panistas.
Y: Peñistas anti-Obradoristas
Z: Panistas-Priístas
De modo que las preferencias quedan como sigue:




Orden de preferencias en los votantes
Candidatos
X
Y
Z
Obrador
Peña
Creel



Ahora consideremos que existe un sector (Z) que a último momento cambia el orden de sus preferencias y que es capaz de incidir sobre la agenda pública, es decir, que está en su mano decidir el orden en que habrán de someterse a preferencia las parejas de candidatos en determinada encuesta de suma importancia, quedando la configuración como se muestra a continuación:


Orden de preferencias en los votantes
Candidatos
X
Y
Z
Obrador
Peña
Creel


Enfrentemos por votación simple a los candidatos.

En (O,P) queda que P < O, ya que supera 2 a 1 en las preferencias de los votantes.
En (P,C) queda que C <  P.
En (O,C) queda que O <  C.

Note cómo se rompe la transitividad en cualquier caso. ¿Cómo determinar la preferencia global?

Pero el problema se incrementa a la hora en que desarrollamos la agenda pública.

i) En primer lugar se enfrenta a Obrador con Peña, de lo que se sabe que P <  O. Entonces Obrador se enfrentaría con Creel. De ahí resulta O <  C, o sea, P < O < C. Creel ganaría a pesar de que se tenía con anterioridad C < P.

ii) Si iniciamos Peña con Creel, ganaría Peña, que enfrentado por Obrador, éste último sería el vencedor. 
C < P < O, pero O < C.

iii) Si iniciamos con Obrador Creel, Peña sería el vencedor en la elección.

Como puede verse, el votante Z, a menudo llamado "votante pivotal", tendría en sus manos la última palabra en el destino de la elección, podría inclinar la balanza en favor de cualquier candidato independientemente de las preferencias de los votantes, incluso a pesar de que en todos los casos la transitividad, y con ello el criterio de racionalidad del proceso de elección, se halle fracturada, justo como lo señalara Kenneth.

La paradoja de Bernoulli.

Otro conflicto donde el concepto de racionalidad se ve involucrado y que provoca incertidumbre, es un juego que dio origen a la llamada paradoja de San Petesburgo. La paradoja surge justo cuando nos preguntamos por las razones que  terminan por convencer a un jugador de entrar en una situación de aparente riesgo. Nadie dudaría que la decisión de tomar partido en un juego es razonable cuando el jugador sabe que el pago que le espera supera en buena medida a la cantidad que tiene que arriesgar (apuesta). Para entender el concepto de pago esperado o esperanza matemática fijémonos en el siguiente juego.

Se tienen dos ruletas, cada una con tres números. A={8,7,1} y B={4,5,6} El juego consiste en que cada jugador (2) tendrá que echar a rodar la ruleta que haya elegido. Una vez detenidas se comparan los números obtenidos, el jugador que tenga el número más grande gana un punto, de lo contrario pierde 1.  ¿Cual es el pago esperado de cada jugador?

Como cada ruleta tiene 3 números, hay nueve posibles jugadas, cada una con probabilidad 1/9. De ahí que:

EA=1/9 (+1+1+1+1+1+1-1-1-1) = 1/9 (3) = 1/3. (Si sale 8 o 7 siempre gana A; con 1 siempre pierde)

Para el otro jugador se tiene el mismo pago pero en negativo. EB= -1/3. Por lo tanto A dominará el juego.

Para el caso de la paradoja de Bernoulli el juego se formula así:

Cada jugador debe empezar apostando alguna cantidad. A continuación se le da una moneda al primero y comenzará a echarla al aire hasta que le salga por primera vez águila. Si esto ocurre en la tirada "n", entonces toma 2n pesos y deja al otro jugador hacer sus tiradas. Se nota de entrada que el juego exige una apuesta grande para poder desarrollarse, lo cual se torna riesgoso para ambos jugadores a menos que el pago esperado sea prometedor. Hagamos el cálculo.

La probabilidad de que salga águila en la primera tirada es 1/2, a la segunda es 1/4, 1/8 a la tercera y así sucesivamente. El pago correspondiente en cada caso es  21, 22, 23, etc. 
n = 1 A,S
n=2 AA, AS, SASS.
n=3 AAA, AAS; ASA. ASS, SSS, SSA, SAS. SAA. 

Por lo tanto:

E = (1/2) 21+ (1/4) 2+ ...+ (1/2) 2= 1 + 1 +...+ 1 = n, pago que crece en la medida que el jugador tenga más partidas, y por ende, su apuesta sea mayor. El comportamiento racional en este caso sería elevar las apuestas, ya que el pago esperado crece indefinidamente, sin embargo la experiencia revela que los jugadores en la práctica no siguen esta conducta.

Para lidiar con ésta paradoja se han presentado diversas objeciones. La primera de ellas es de orden moral: las personas se rehúsan  a verse sometidas al riesgo. La segunda de ellas tiene que ver con que algunas jugadas sencillamente son imposibles: esperar obtener 10 lanzamientos sin que aparezca águila es inverosímil. La tercera tiene que ver con la estructura misma vía  el mínimo y el máximo pago esperado en cada jugada:

En la primer tirada el mínimo pago posible según la esperanza matemática es 1/2(21) = 1; el máximo es 21. En el segundo pago el mínimo sería 2 y el máximo 4. En general el la tirada n, min = n y max = 2n. Como el juego se define para todos los naturales, en el infinito el mínimo pago sería ℵ; el máximo 2c, que es la cardinalidad de los reales, pago que es imposible entregar en unidades monetarias.

1 comentario:

  1. X:Obradoristas anti-panistas.
    Y: Peñistas anti-Obradoristas
    Z: Panistas-Priístas
    (anti-priistas)

    En la paradoja de Bernoulli, tiene razòn en que cada persona es llevada a la anticipaciòn de decisiones arriesgadas, "quiera o no"

    ResponderEliminar