Problema de Monty Hall

problema matemático


El problema de Monty Hall o paradoja de Monty Hall es un problema matemático de probabilidad basado en el concurso televisivo estadounidense Trato hecho (Let's Make a Deal). El problema fue planteado y resuelto por el matématico Steve Selvin, en la revista American Statistician en 1975 y posteriormente popularizado por Marilyn vos Savant en Parade Magazine en 1990. El problema fue bautizado con el nombre del presentador de dicho concurso, Monty Hall.

La premisa

editar

El concursante debe elegir una puerta entre tres (todas cerradas); el premio consiste en llevarse lo que se encuentra detrás de la elegida. Se sabe con certeza que tras una de ellas se oculta un coche, y tras las otras dos hay cabras. Una vez que el concursante haya elegido una puerta y comunicado su elección a los presentes, el presentador, que sabe lo que hay detrás de cada puerta, abrirá una de las otras dos, en la que habrá una cabra. A continuación, le da la opción al concursante de cambiar, si lo desea, de puerta (tiene dos opciones). ¿Debe el concursante mantener su elección original o escoger la otra puerta? ¿Hay alguna diferencia?

Esa pregunta generó un intenso debate. Como la respuesta correcta parece contradecir la intuición, es una paradoja.

La premisa original

editar

A continuación se expone el enunciado más famoso del problema, extraído de una carta [1] de Craig F. Whitaker a la columna de Marilyn vos Savant en Parade Magazine en 1990 (como la citan Bohl, Liberatore y Nydick).

Supón que estás en un concurso, y se te ofrece escoger entre tres puertas: detrás de una de ellas hay un coche, y detrás de las otras, cabras. Escoges una puerta, digamos la nº1, y el presentador, que sabe lo que hay detrás de las puertas, abre otra, digamos la nº3, que contiene una cabra. Entonces te pregunta: "¿No prefieres escoger la nº2?". ¿Es mejor para ti cambiar tu elección?

En la carta posterior de Selvin a American Statistician (agosto de 1975) aparece la que parece ser la primera mención del término "problema de Monty Hall".

Un problema análogo denominado "problema de los tres prisioneros" apareció en la columna Mathematical Games, de Martin Gardner, en 1959. La versión de Gardner hace el proceso de elección explícito, evitando las suposiciones de la versión original.

La manera más intuitiva de visualizar la mejor estrategia es teniendo en cuenta que tienes 2/3 de probabilidad de elegir una cabra y luego el presentador te desvela dónde está la otra. Por descarte, lo más probable es que el coche esté en la puerta restante y, en concreto, con 2/3 de probabilidad.

La premisa completa

editar

Se ofrece un concurso cuya mecánica es la siguiente:

  • Al concursante se le ofrece la posibilidad de escoger una entre tres puertas. Tras una de ellas se encuentra un coche, y tras las otras dos hay cabras. El concursante gana el premio que se oculta detrás de la puerta que escoja.
  • Después de que el concursante escoja una puerta, el presentador abre una de las otras dos puertas, mostrando una cabra. Siempre puede hacerlo, ya que incluso si el concursante ha escogido una cabra, queda otra entre las puertas que ha descartado y el presentador conoce lo que hay detrás de cada puerta.
  • Entonces, ofrece al concursante la posibilidad de cambiar su elección inicial y escoger la otra puerta que descartó originalmente, que continúa cerrada.

La pregunta oportuna es: ¿debe hacerlo o no?

La solución

editar

Suposiciones iniciales

editar

Esta solución se basa en tres suposiciones básicas:

  • que el presentador siempre abre una puerta,
  • que tras la que el presentador ha abierto siempre hay una cabra, puesto que conoce lo que hay detrás de cada puerta,
  • que el presentador la escoge entre las dos restantes después de que el concursante haya escogido la suya.

Un estudio probabilístico

editar
El coche tiene una probabilidad de 1/3 de estar detrás de la puerta elegida por el jugador. Las otras dos puertas tienen una probabilidad de 2/3.
Cuando el anfitrión abre una puerta, las probabilidades para los dos conjuntos no cambian, pero las probabilidades se mueven a 0 para la puerta abierta; y 2/3 para la puerta cerrada (2).

La probabilidad de que el concursante escoja en su primera oportunidad la puerta que oculta el coche es de 1/3, por lo que la probabilidad de que el coche se encuentre en una de las puertas que no ha escogido es de 2/3. ¿Qué cambia cuando el presentador muestra una cabra tras una de las otras dos puertas?

Una suposición errónea es que, una vez que sólo queden dos puertas, ambas tienen la misma probabilidad (es 1/2) de tener el coche. Es errónea ya que el presentador abre la puerta después de la elección del jugador. Esto es, la elección del jugador afecta a la puerta que abre el presentador. No es un suceso aleatorio ni inconexo.

Si el jugador escoge en su primera opción la puerta que tiene el coche (con una probabilidad de 1/3), entonces el presentador puede abrir cualquiera de las otras dos puertas. Además, el jugador pierde el coche si cambia cuando se le ofrece la oportunidad, puesto que había acertado.

Pero, si el jugador escoge una cabra en su primera opción (con una probabilidad de 2/3), el presentador sólo tiene la opción de abrir una puerta, y esta es la única puerta restante que contiene una cabra. En ese caso, la puerta restante tiene que contener el coche, por lo que cambiando lo gana, puesto que había elegido cabra en primera opción.

En resumen, si mantiene su elección original gana si escogió originalmente el coche (con probabilidad de 1/3), mientras que si cambia, gana si escogió originalmente una de las dos cabras (con probabilidad de 2/3). Por lo tanto, el concursante debe cambiar su elección si quiere maximizar la probabilidad de ganar el coche.

Detrás de la puerta 1 Detrás de la puerta 2 Detrás de la puerta 3 Resultado si se mantiene la selección de la puerta 1 Resultado si se cambia de puerta
Cabra Cabra Coche Ganar una cabra Ganar un coche
Cabra Coche Cabra Ganar una cabra Ganar un coche
Coche Cabra Cabra Ganar un coche Ganar una cabra

Planteamiento matemático

editar

Sea X:( , P) → {1,2,3} la puerta aleatoria detrás de la cual se encuentra el coche. Sea Y:( , P) → {1,2,3} la puerta que escoge aleatoriamente el candidato. Las variables aleatorias X e Y son estocásticamente independientes. Sea M: ( , P) → {cabra, coche} lo que se encuentra detrás de la puerta que el moderador escoge (entre las que aún no se han abierto y siempre una cabra). Se cumple entonces [M=cabra] con probabilidad 1 (o siempre), es decir: P[M=cabra] = 1. La probabilidad de que el candidato se lleve el coche bajo el supuesto de que él no cambia de puerta es entonces P[X=Y|M=cabra] = P[X=Y]/P[M=cabra] = (1/3)/1 = 1/3. Por otro lado, la probabilidad de que el candidato se lleve el coche bajo el supuesto de que él cambia de puerta es entonces: P[X≠Y|M=cabra] = 1 - P[X=Y] = 2/3. Esta es la solución correcta.

Una "solución" incorrecta se obtiene de la siguiente interpretación: Si, por otro lado, el presentador escoge de manera aleatoria y uniforme entre las puertas que aún no se han abierto, entonces la probabilidad de que el candidato se lleve el coche (dado que él no cambia de puerta) es P[X=Y|M=cabra]=P[X=Y]/P[M=cabra]=P[X=Y]/(P[M=cabra|X=Y]P[X=Y] + P[M=cabra|X≠Y]P[X≠Y])=(1/3)/(1/3 + (1/2)*(2/3)) = 1/2. Por lo tanto, 0,5 es la probabilidad de que el candidato se lleve el coche (dado que él cambia de puerta), pero esta respuesta no es aplicable a nuestro problema.

Otra forma para ver el planteamiento es la siguiente: Definimos los eventos A: El concursante elige la puerta con el premio antes de cambiar de opción y; B: El concursante elige la puerta con el premio después de cambiar de opción. Entonces aplicando el teorema de Probabilidad Total, tenemos: P[B]=P[BA]+P[BÂ]=P[B|A]P[A]+P[B|Â]P[Â]=(0)(1/3)+(1)(2/3)= 2/3 (en donde  representa al complemento de A). P[B|A]=0, puesto que son eventos mutuamente excluyentes. P[A]=1/3, debido a que desde el inicio elige una puerta de tres y todas son equiprobables. P[B|Â]=1, es porque si eligió la puerta incorrecta desde el principio y posteriormente realiza el cambio, siempre ganará. P[Â]=2/3, porque P[Â]=1-P[A]=1-1/3=2/3.

Explicación

editar

Lo que muestra el presentador no afecta a la elección original; solo a la otra puerta no escogida. La elección inicial no podía ser revelada, independientemente de su contenido; en cambio la otra podría haber sido eliminada en caso de que no fuera la correcta. Una vez que se abre una puerta y se muestra la cabra, esa puerta tiene una probabilidad igual a 0 de contener un coche, por lo que deja de tenerse en cuenta. Si el conjunto de dos puertas tenía una probabilidad de 2/3 de contener el coche, entonces, si una tiene una probabilidad de 0, la otra debe tener una probabilidad de 2/3. La elección consiste en preguntarle si prefiere seguir con su puerta original o escoger las otras dos puertas. La probabilidad de 2/3 se traspasa a la otra puerta no escogida (en lugar de dividirse entre las dos puertas restantes de modo que ambas tengan una probabilidad de 1/2) porque en ningún caso puede el presentador abrir la puerta escogida inicialmente. Si el presentador escogiese al azar y abriese una de las dos puertas con cabras (siendo una de estas posiblemente la del concursante), y luego diese de nuevo una posibilidad de elegir entre las demás, entonces las dos puertas restantes sí tendrían la misma probabilidad de contener el coche. Es necesario tener en cuenta la situación en como se dan las cosas.

Causas del error

editar

El razonamiento intuitivo que nos lleva a la conclusión errónea es que como hay dos puertas, una con el coche y otra con la cabra, y no sabemos en cuál de las dos está el coche, pensamos que cada una tiene 50% o 1/2 de probabilidad. Pero este razonamiento no toma en cuenta el conocimiento con que las puertas fueron elegidas. Para ilustrar, supongamos que no conocemos el año de cierto acontecimiento histórico, pero nos dan como únicas opciones 1990 y 1991. Si no tenemos más información, podemos decir que cada una tiene 1/2 de probabilidad, pero si le preguntamos a un estudiante que no suele sacar buenas notas, titubea e inseguro nos dice que es 1990, y luego le preguntamos a un profesor de historia y muy convencido nos dice que es 1991, no sería adecuado asignarle 1/2 de probabilidad a cada opción. La diferencia entre las dos es el respaldo que tienen. Una está respaldada por alguien que podemos considerar ignorante, y la otra está respaldada por un sabio. No es imposible que el profesor esté equivocado, pero sabemos que eso es menos frecuente.

En el problema de Monty Hall sucede que el presentador conoce las posiciones y está forzado a dejar el automóvil oculto para la segunda ronda. Las únicas dos puertas que permanecerán tapadas son la que eligió el concursante al principio y otra que decida el presentador. Ahora bien, el concursante elige una puerta que esconde una cabra con una frecuencia de 2/3, es decir, la mayoría de las veces, lo que significa que la otra puerta que deje cerrada el presentador tendrá que ser la del coche en esa misma mayoría de las veces para que pueda permanecer oculto. En otras palabras, el presentador elige el coche con más frecuencia que el concursante, y por eso es más probable que se gane cambiando a que se gane manteniendo la elección original.

De otra parte, la equivocación de la gente proviene de pensar que cuando nos ofrecen cambiar de puerta, entonces hubiera empezado un nuevo juego en el que el presentador toma el coche y decide ahora al azar en qué puerta de las dos que quedan colocarlo. Y ese sí que sería un "nuevo "juego al 50% Pero en el juego que estamos jugando el coche se colocó en inicio por ejemplo entre 100 puertas, y tu puerta teniendo una probabilidad 1/100 , y el resto de puertas, como grupo, del 99/100, probabilidad que nunca se pierde y que "obliga" siempre a cambiar. Recordemos que el juego debe ser aleatorio. Si el presentador pusiera siempre el coche en la puerta 1, el razonamiento anterior no serviría, pero entonces, sabedores, los sucesivos jugadores tendrían certeza al elegir. Ahora bien, ¿nos equivocaríamos si al principio del concurso, con 100 puertas, nos preguntaran ... ¿qué prefiere usted elegir, una puerta o las otras 99 puertas ? Pues eso es lo que inadvertidamente está sucediendo.

Explicación matemática

editar

Si utilizamos como ejemplo el concurso de las tres puertas y la cabra, el problema se visualiza así:

Se puede explicar fácilmente con una simple ecuación matemática, donde hay que saber el número total de puertas, cuántas se eligen al principio y en cuántas se ha enseñado que no está el coche.

 

donde:

  es la probabilidad de abrir la puerta tras la cual está el coche.
  es el número de puertas elegidas al principio.
  es el número de puertas en las que se ha enseñado que dentro no hay nada.
  es el número total de puertas.

Se tiene que cumplir que   sea un número entero (las puertas no se pueden partir),   y  .

Si   las probabilidades de abrir la puerta que contenga el coche son del  .

Ejemplo con tres puertas

editar

Si tenemos tres puertas( ), y de ellas se ha elegido una puerta (digamos  ), entonces hay   probabilidades de elegir la puerta que contenga el coche, siendo:)

 

La probabilidad sería:

 

Tiene sentido porque si se elige una puerta ( ) entre un conjunto de puertas ( ), hay una probabilidad del   de abrir la puerta que contiene el coche.

Pero si se enseña una puerta ( ) las probabilidades de abrir la puerta que contiene el coche se agrandarían. Siendo:

 

La probabilidad de abrir la puerta que contenga el coche sería:

 

Ejemplo con 100 puertas

editar

Si tenemos 100 puertas ( ), y de ellas se ha elegido una puerta (digamos  ), entonces hay   probabilidades de elegir la puerta que contiene el coche, siendo:

 

La probabilidad de abrir la puerta que contiene el coche sería:

 

Pero si se enseñan 98 puertas ( ) las probabilidades de acertar la puerta se agrandan (solo quedan dos puertas cerradas, la que se ha elegido y la que han dejado cerrada. 98 puertas están abiertas y sabemos que dentro no está el coche). Siendo:

 

La probabilidad de abrir la puerta que dentro contiene el coche sería:

 

Explicaciones alternativas

editar

El problema con las 100 puertas

editar

Una forma más clara de verlo es replantear el problema. Si en lugar de haber solo tres puertas hubiese 100, y tras la elección original el presentador abriese 98 de las restantes para mostrar que tras de ellas hay cabras. Si no cambiase su elección, ganaría el coche solo si lo ha escogido originalmente (1 de cada 100 veces); mientras que si la cambia siempre, ganaría cada vez que no lo haya escogido originalmente, o sea, 99 de cada 100 veces. Si en un juego particular la puerta correcta fuese la 30, por poner un ejemplo, tenemos los siguientes casos:

1- El concursante elige la puerta 1. El presentador revela todas menos la 1 y la 30. Se gana cambiando.

2- El concursante elige la puerta 2. El presentador revela todas menos la 2 y la 30. Se gana cambiando.

3- El concursante elige la puerta 3. El presentador revela todas menos la 3 y la 30. Se gana cambiando.

...

98- El concursante elige la puerta 98. El presentador revela todas menos la 98 y la 30. Se gana cambiando.

99- El concursante elige la puerta 99. El presentador revela todas menos la 99 y la 30. Se gana cambiando.

100- El concursante elige la puerta 100. El presentador revela todas menos la 100 y la 30. Se gana cambiando.

La única manera de ganar manteniendo la elección inicial es si al principio el concursante eligió la puerta 30. Esto es, debe haber acertado la correcta teniendo 100 posibilidades.

Imaginar que el presentador es otro concursante

editar

Dado que desde el punto de vista del presentador, seleccionar la puerta que debe abrir entre las dos restantes es lo mismo que seleccionar la puerta que no debe abrir, a éste puede imaginársele como otro concursante y la puerta que deja cerrada es su elección. A diferencia del primer participante, él tiene la ventaja de conocer el contenido de cada una de las puertas. Si fuera el primero en escoger, sería libre de elegir siempre la puerta del coche, por lo que podría ganarlo el 100% de las veces. Pero tiene el inconveniente de que otro concursante va a seleccionar primero, y luego él tiene que escoger una que no haya sido la puerta del primero. Si el primer concursante elige la puerta del coche, lo cual ocurre 1/3 de las veces, el presentador solo podrá escoger una puerta con una cabra, pero si el primero falla, lo cual ocurre en los 2/3 restantes, el presentador ganará.

Decidir cambiar es equivalente a apostar porque ganó el presentador, es decir, por el concursante que conocía los contenidos, y decidir no cambiar es equivalente a apostar por el concursante que hizo una selección al azar. Un concursante tiene ventaja sobre el otro. De este modo, se aprecia que la segunda elección en el problema de Monty Hall no es una decisión aleatoria entre dos puertas indistinguibles, en cuyo caso las probabilidades sí serían de 1/2. En este caso tenemos dos posiciones bien diferenciadas: puerta de cambiar y puerta de no cambiar. El hecho de que el coche se encuentre en una o en otra depende de dos eventos con distinta probabilidad. Estará en la puerta de no cambiar si y solo si al principio se acertó (1/3), y estará en la otra si y solo si al principio se falló (2/3).

Una explicación gráfica

editar

Por si no se ve claro, aquí va una explicación gráfica: Tenemos tres cajas:

([?]) vs ([?][?]) ahora hay dos grupos: la caja que se escogió (con probabilidad 1/3 y el grupo de las otras dos cajas (con probabilidad 2/3).

([?]) vs ([?][?]) = 1/3 vs (1/3,1/3)

Se descubre una cabra del grupo de las dos cajas.

([?]) vs ([B][?]) = x vs (0,1-x)


¿Dónde es más probable que se encuentre el premio? ¿en la caja escogida o entre las otras dos (aunque una esté descubierta)?

Evidentemente es más probable que esté entre las otras dos.

Comprobémoslo con seis cajas (cinco contienen cabra y una premio):

([?][?][?][?][?][?]) antes de empezar hay una probabilidad de 1/6 de encontrar el premio dentro del grupo.

Elijo la primera (o cualquier otra).

([?]) vs ([?][?][?][?][?]) ahora hay dos grupos: la caja que se escogió (con probabilidad de 1/6 y el grupo de las otras cinco cajas (con probabilidad 5/6).

Preguntémonos en este punto: ¿dónde es más probable que esté el premio; en la caja elegida (1/6) o entre las cinco restantes (5/6)?

Se descubren cuatro cabras.

([?]) vs ([B][B][?][B][B])=1/6 vs 5/6.

Otra vez la misma pregunta: ¿dónde es más probable que esté el premio, en la caja escogida o entre las otras 5? La respuesta sigue siendo la misma porque la única puerta cerrada de las cinco originales no seleccionadas mantiene la probabilidad de todo el conjunto de puertas no elegidas.

Otra explicación gráfica e intuitiva: sobres y cajas

editar

El presentador muestra al concursante tres sobres y dos cajas vacías, la caja número 1 y la caja número 2. Únicamente uno de los sobres contiene un premio. A continuación pide al concursante que escoja uno de los sobres y lo introduzca en la caja número 1. Los otros dos los guarda en la caja número 2. Entrega la caja número 1 al concursante (con el sobre elegido), y aparta la caja número 2 (con los dos sobres restantes). Si en ese momento le diera al concursante la opción de cambiar de caja, la respuesta sería obvia, pero la elección ya está hecha. Sin embargo, sorprendentemente, da al concursante la oportunidad de cambiar la caja 1 por la 2, con la condición de que antes de entregársela le deje sacar de ella un sobre NO PREMIADO (para qué lo quiere) y dejar el otro. Es evidente que nada relevante ha cambiado en el contenido de las cajas, y el concursante debería aceptar encantado la oferta y quedarse finalmente con la caja número 2, que no ha perdido valor.

La caja número 1 (con un sobre) tenía y sigue teniendo una probabilidad de 1/3 de resultar premiada, y la probabilidad de caja número 2 (con dos sobres) era, y sigue siendo, de 2/3, porque el hecho de retirar un sobre sin premio (y por tanto, sin ningún valor) no cambia nada.

editar

En el capítulo 200 (9x18) de la temporada 9 de la serie Los cazadores de mitos titulado "La rueda de la mitofortuna" estudian el problema de Monty Hall.

En un episodio de la serie Friends, Chandler Bing hace referencia a Monty Hall en la cena previa a la boda de Ross Geller y Emily Waltham, cuando hace lo que él llama un "brindicito".

En el capítulo 101 del libro El curioso incidente del perro a medianoche (2003), Christopher recurre al problema de Monty Hall para demostrar que la intuición puede hacer que nos equivoquemos, mientras que la lógica puede ayudarnos a deducir la respuesta correcta.

En la película 21 blackjack (2008), durante una clase de matemática avanzada, el profesor Mickey Rosa (Kevin Spacey) desafía a Ben Campbell (Jim Sturgess) a que descifre un problema acerca de tres puertas con cambios variables (problema de Monty Hall); éste lo resuelve con éxito.

También se describe esta paradoja en el capítulo 15 de la novela Operación Dulce, de Ian McEwan.

En el episodio octavo de la cuarta temporada de Brooklyn Nine-Nine, los personajes también tienen que resolver esta paradoja.

En el capítulo 4 de la segunda temporada de The Hollow, los participantes deben resolver el problema para avanzar.

El capítulo 4 de la primera temporada de la serie D. P.: El cazadesertores se titula «El problema de Monty Hall», y la paradoja se emplea para ilustrar el razonamiento detrás de las decisiones de un personaje y el hilo conductor del relato.

Referencias

editar
  • Bapeswara Rao, V. V. and Rao, M. Bhaskara (1992). "A three-door game show and some of its variants". The Mathematical Scientist 17, no. 2, pp. 89–94
  • Bohl, Alan H.; Liberatore, Matthew J.; and Nydick, Robert L. (1995). "A Tale of Two Goats... and a Car, or The Importance of Assumptions in Problem Solutions". Journal of Recreational Mathematics 1995, pp. 1–9.
  • Joseph Bertrand (1889) Calcul des probabilites
  • Gardner, Martin (1959). "Mathematical Games" column, Scientific American, October 1959, pp. 180–182. Reprinted in The Second Scientific American Book of Mathematical Puzzles and Diversions.
  • Gnedin, Sasha "The Mondee Gills Game." The Mathematical Intelligencer, 2011 http://www.springerlink.com/content/8402812734520774/fulltext.pdf (enlace roto disponible en Internet Archive; véase el historial, la primera versión y la última).
  • Martin, Phillip (1989). "The Monty Hall Trap", Bridge Today, May-June 1989. Reprinted in Granovetter, Pamela and Matthew, ed. (1993), For Experts Only, Granovetter Books.
  • Mueser, Peter R. and Granberg, Donald (1999), "The Monty Hall Dilemma Revisited: Understanding the Interaction of Problem Definition and Decision Making" (University of Missouri Working Paper 99-06). http://econwpa.wustl.edu:80/eps/exp/papers/9906/9906001.html Archivado el 10 de diciembre de 2004 en Wayback Machine. (retrieved July 5, 2005).
  • Nahin, Paul J. Duelling idiots and other probability puzzlers. Princeton University Press, Princeton, NJ: 2000, pp. 192-193. (ISBN 0-691-00979-1).
  • Selvin, Steve (1975a). "A problem in probability" (letter to the editor). American Statistician 29(1):67 (February 1975).
  • Selvin, Steve (1975b). "On the Monty Hall problem" (letter to the editor). American Statistician 29(3):134 (August 1975).
  • Tierney, John (1991). "Behind Monty Hall's Doors: Puzzle, Debate and Answer?", The New York Times 21 July 1991, Sunday, Section 1; Part 1; Page 1; Column 5
  • vos Savant, Marilyn (1990). "Ask Marilyn" column, Parade Magazine p. 12 (17 February 1990). [cited in Bohl et al., 1995]
  • Adams, Cecil (1990). "On 'Let's Make a Deal,' you pick Door #1. Monty opens Door #2--no prize. Do you stay with Door #1 or switch to #3?", The Straight Dope November 2 1990. http://www.straightdope.com/classics/a3_189.html (retrieved July 25, 2005).
  • Tijms, Henk (2004). Understanding Probability, Chance Rules in Everyday Life. Cambridge University Press, New York, pp. 213-215.
  • Ziemer, Rodger E. (1997). Elements of Engineering Probability & Statistics. Prentice Hall, pp. 31-32.

Véase también

editar

Enlaces externos

editar