Intuición en la probabilidad

En esta lectura vamos ha demostrar que nuestra intuición para las probabilidades no es muy buena. Pensemos en esta pregunta: ¿Cuántas personas debería haber en una reunión para que la probabilidad de que al menos dos de ellas cumplan años el mismo día sea mayor del 50%? Para analizar esta pregunta haremos las siguientes consideraciones:
  • Supongamos que todas las fechas de cumpleaños son igualmente probables.
  • Con el fin de simplificar el análisis descartamos el año bisiestos, es decir, la fecha del 29 de Febrero, debido a que si se incluye tendría poco efecto en las respuestas. 
Ahora veamos que la pregunta satisface la existencia de los sucesos extremos, en efecto, si hay sólo una persona, entonces la probabilidad de que la misma fecha de cumpleaños ocurra dos veces es cero. Si hay 366 personas, entonces la misma fecha de cumpleaños debe ocurrir al menos dos veces y por tanto la probabilidad es 1. Lo que permite deducir que en alguna parte entre 1 y 366 está el punto de equilibrio donde, en promedio, la mitad de las reuniones festivas incluyen a dos personas o más con la misma fecha de cumpleaños. ¿Cuántas personas hay en una reunión semejante? ¿100? ¿150? ¿182? Después de todo, hay 365 fechas de cumpleaños según la segunda consideración que hemos hecho. 

¿Creería usted que son 23? parece sorprendentemente pequeño. Pero 23 es la respuesta correcta. He aquí otra pregunta engañosamente parecida: ¿Cuántas personas, además de usted mismo, debería haber en una reunión para que la probabilidad de que al menos una de ellas tenga la misma fecha de cumpleaños que usted sea mayor del 50%?

Esta vez la respuesta es 253 sin contarle a usted. Suena demasiado grande, ¿no? ¿Y por qué dos preguntas tan parecidas tienen respuestas tan diferentes?

Bien, para responder la primera pregunta, debemos aplicar uno de los trucos más sutiles en el calculo de probabilidades: La regla No, lo que equivale a responder ¿cuándo no sucede el suceso al menos dos personas tienen la misma fecha de cumpleaños? Cuando todas sus fechas de cumpleaños son diferentes, por supuesto. Supongamos que aumentamos el número de personas en la reunión, de una en una, empezando con tan sólo una de ellas. Podemos calcular la probabilidad de que una nueva persona tenga una fecha de cumpleaños diferente de la de todas las anteriores. Veamos cuán difícil es que esto suceda. Tan pronto como la probabilidad caiga por debajo del 50%, sabemos que la probabilidad del suceso original al menos dos personas tienen la misma fecha de cumpleaños ha aumentado por encima del 50%.

Muy bien, aquí va. Con sólo una persona, ¡no hay ningún problema en hacer todas las fechas de cumpleaños diferentes! De modo que la probabilidad en tal caso es 1.

Ahora la segunda persona en entrar a la reunión tendrá 364 días diferentes para que las fechas de cumpleaños sean diferentes. De modo que con dos personas en la habitación, la probabilidad de que sus fechas de cumpleaños sean diferentes es \begin{align}\frac{364}{365}\end{align} Entra la persona 3. Ahora hay 363 elecciones para que todas las fechas de cumpleaños sean diferentes, de modo que la probabilidad de que la persona 3 tenga una fecha de cumpleaños que difiere de las otras dos es 363/365. Por la regla Y, la probabilidad combinada de que la fecha de cumpleaños de la persona 2 difiera de la persona 1, y la fecha de cumpleaños de la persona 3 difiera de las personas 1 y 2, es\begin{align}\left(\frac{364}{365}\right)\left(\frac{363}{365}\right),\end{align}Ahora empezamos a ver una pauta. Cuando la persona 4 entra en la habitación, la regla Y nos dice que esta probabilidad debe multiplicarse por 362/365, para dar \begin{align}\left(\frac{364}{365}\right)\left(\frac{363}{365}\right)\left(\frac{362}{365}\right),\end{align} y así sucesivamente. En general, después de que la persona $n$ ha entrado en la reunión, la probabilidad de que las $n$ fechas de cumpleaños sean diferentes es: \begin{align}\prod_{k=1}^n\left(\frac{365-(k-1)}{365}\right)\end{align}Todo lo que tenemos que hacer ahora es tabular valores sucesivos de esta expresión (productoria) y ver cuándo cae por debajo de 0.5 (una probabilidad de un 50%). El siguiente App muestra lo que sucede.

Applet 1. Distribución de personas que tengan la misma fecha de cumpleaños en una reunión.

Aplicando la regla No. Vemos que con 23 personas la probabilidad de que todas las fechas de cumpleaños sean diferentes es 0.4927, ligeramente menor que 0.5. Lo que significa que cuando 23 personas entren en la reunión, la probabilidad de que al menos dos de ellas tenga la misma fecha de cumpleaños es 1 - 0.4927 = 0.5073, ligeramente mayor que 0.5. Sólo 23. Sorprendente, pero es cierto, inténtelo en fiestas con más de 23 personas. Haga apuestas. A la larga, usted ganará. En fiestas grandes ganará fácilmente. Para ser más preciso en una fiesta que supere los 40 invitados, la probabilidad de este suceso es del 90%.

¿Por qué es tan mala nuestra intuición? es posible que solo nos hemos centrado en un aspecto del problema. Comparémoslo con la segunda pregunta. Usted está en una reunión y empieza a entrar gente. ¿Cuántas personas debe haber para que la probabilidad de que una de ellas tenga la misma fecha de cumpleaños que usted sea mayor del 50%? ¿Es la respuesta 364/2, es decir 182 personas? Después de todo, hay 364 fechas de nacimiento que difieren de la suya, y la mitad de éstas han sido consumidas...

No, como se menciono antes, es realmente 253. ¡Ahora eso suena demasiado grande! Pero una vez más, un poco de reflexión muestra que es cierto. De nuevo, nos centramos en la probabilidad de que las fechas de cumpleaños sigan siendo diferentes de la suya, y luego aplicamos la regla No.

Supongamos sin perdida de generalidad, que su fecha de cumpleaños es un 20 de Julio. La probabilidad de que la primera persona que entre a la reunión tenga una fecha de cumpleaños diferente de esta es 364/365. La probabilidad de que la segunda persona que entre en la reunión tenga una fecha de cumpleaños diferente del 20 de Julio es también 364/365. Y lo mismo sucede con la tercera, la cuarta,..., la $n$-ésima persona.

No estamos interesados en la coincidencia entre las fechas de cumpleaños de las personas que entran. Por ejemplo, en que Sofia y Santiago han nacido ambos el 12 de octubre. Eso no importa: todo lo que cuenta es si su fecha de cumpleaños es o no el 20 de Julio. Mediante el uso repetitivo de la regla Y en la entrada de $n$ personas, la probabilidad que todas ellas tengan fechas de cumpleaños diferentes del 20 de Julio es por consiguiente \begin{align}\left(\frac{364}{365}\right)^n\end{align} El siguiente App muestra lo que sucede a medida que el valor de $n$ aumenta. Recuerde que el valor que se busca de $n$ es aquel que hace un calculo por debajo de 0.5 

Applet 2. Distribución de personas que tengan la misma fecha de cumpleaños con usted en una reunión.

Aplicando la regla No. Vemos que con 253 personas la probabilidad de que todas las fechas de cumpleaños sean diferentes a la del 20 de Julio es 0.49952, ligeramente menor que 0.5. Lo que significa que cuando 253 personas entren en la reunión, la probabilidad de que al menos una de ellas tenga esta fecha de cumpleaños es 1 - 0.4927 = 0.50048, ligeramente mayor que 0.5. El mismo cálculo funciona cualquiera que sea su fecha de cumpleaños, por supuesto. No hay nada especial en el 20 de Julio.

Note que aquí también existen los sucesos extremos: Si no hay personas a parte de usted $(n=0)$, la probabilidad de que alguien tenga la misma fecha de cumpleaños suya es cero, y cuando el número de personas es muy grande $(n\to\infty)$, esta tiende a uno. 

----------------------------------------------------------------------------------------------------------------------------------------------------

Tomado y adaptado del libro: El Laberinto Mágico, IAN STEWART. Editorial booket pags. 103-107.

No hay comentarios:

Publicar un comentario