¿Cuál es la probabilidad de tener dos hijos varones, si uno de ellos se llama Francis?

Por Francisco R. Villatoro, el 7 enero, 2010. Categoría(s): Ciencia • Matemáticas • Science ✎ 5

Los que hemos impartido cursos de Estadística y Probabilidad sabemos de las grandes dificultades que presenta el Arte de la Probabilidad, el planteamiento, que no la resolución, de problemas de probabilidad para los alumnos. Me ha recordado dichas dificultades un ejemplo curioso que nos presenta en detalle el italiano Giulio D’Agostini, «On the so called Boy or Girl Paradox,» ArXiv, 5 Jan 2010. 

Supongamos que la probabilidad de que nazca un niño (m) es exactamente igual a la de que nazca una niña (f), aunaque en realidad se sabe que no son exactamente iguales. La tabla de la izquierda presenta la probabilidad de nacimiento en función del sexo de los dos primeros hijos de una pareja, el mayor y el menor. Veamos algunas preguntas fáciles (triviales).

Pregunta: ¿Cuál es la probabilidad de que los dos hijos sean niños? Obviamente 1/4 (o el 25 %), basta ver la tabla.

Pregunta: ¿Cuál es la probabilidad de que los dos hijos sean niños, si el mayor es un niño? Obviamente 1/2 (o el 50%).

Pregunta: ¿Cuál es la probabilidad de que los dos hijos sean niños, si al menos uno de los hijos es un niño? Sólo hay tres casos posibles, luego la respuesta es 1/3.

Ahora es el momento para la pregunta «difícil,» la del título de esta entrada, ¿cuál es la probabilidad de que los dos hijos sean niñas, si una de los niñas se llama Francisca? La cuestión es cómo cambia las probabilidades el hecho de que sepamos el nombre de uno de los hijos. ¿Importa el nombre que sea? Todos sabemos que hay nombres más comunes y otros que lo son menos (llamaremos r a la fracción de niñas que se llaman Francisca en la población considerada).   ¿Pueden dos hijos de una misma pareja tener el mismo nombre? Podemos suponer que sí, ya que existen nombres compuestos, o podemos suponer que no, como suele ser habitual en España. Veamos ambos casos y observaremos la «paradoja.»

Solución permitiendo que dos niñas se llamen igual, Francisca (por ejemplo, María Francisca y Francisca Antonia). La tabla que aparece a la izquierda nos permite resolver fácilmente este problema. Hemos dividido las niñas (f) en dos conjuntos, las niñas con Francisca en su nombre (fN) y el resto de las niñas. La respuesta requiere considerar 3 casos posibles, pero ahora no son equiprobables.

Utilizando probabilidades condicionadas, el resultado es un cociente cuyo denominador está dado por los 5 casos que aparecen en negrita en la tabla de la izquierda y cuyo numerador está dado por los 3 casos entre dichos 5 en los que no aparece ningún varón (m). Es fácil obtener el resultado (te animo a obtenerlo sin leer el artículo de Giulio), que da (1/2) (1-r/2)/(1-r/4), que para r pequeño se aproxima por 1/2 – r/8. Para r pequeño, la probabilidad es próxima a 1/2.

Solución cuando no se permite que las dos niñas se llamen igual (lo habitual en la mayoría de las familias). La tabla que aparece a la izquierda nos permite resolver fácilmente este problema, como se observa falta el caso que hemos prohibido.

Utilizando probabilidades condicionadas, el resultado es un cociente cuyo denominador está dado por los 4 casos que aparecen en negrita en la tabla de la izquierda y cuyo numerador está dado por los 2 casos entre dichos 4 en los que no aparece ningún varón (m). Es fácil obtener el resultado (te animo a obtenerlo sin leer el artículo de Giulio), que da 1/2, independiente del valor de  r. Da lo mismo que el nombre sea más o menos frecuente entre la población considerada. He aquí la «paradoja.»

Los profesores interesados en utilizar es ejemplo en los exámenes de sus asignaturas deben recordar que cualquier identificador que diferencie entre dos clases una población se puede utilizar de igual forma, no tiene por qué ser el nombre y el sexo de los hijos.



5 Comentarios

  1. Me has hecho pensar un rato, Francis.

    El primer problema creo que está bien resuelto, siempre que se considere que para cada hermano el nombre es elegido independientemente. Si decimos en esas condiciones que hay al menos una niña y que su nombre es Paquita, la probabilidad de que sean dos niñas es mayor que 1/3 (y menor que 1/2).

    Sin embargo, la solución del segundo problema cae en una trampa muy evidente. ¿Cómo puede ser un elemento de la matriz de probabilidades (1-2r)/4? Si r>1/2, tenemos una probabilidad negativa.

    La trampa es dar por supuesto que si r de cada 100 niñas se llaman Paquita, entonces también r de cada 100 niñas sin hermano varón mayor se llaman Paquita. Eso no se sigue de las condiciones; aún más, es imposible para ciertos valores de r.

    El problema tiene solución, pero que la busque D’Agostini por sí solo 🙂

    1. Gracias, José Luis, por tu comentario. El propio D’Agostini responde a tu pregunta. "Note that the impossibility of identical children names constrains r to be smaller than 1/2, well above any reasonable value. Remember also that the probabilities of table 4 reflect the several simplifying assumptions of the problem.» Es decir, si es imposible que los dos hijos tengan el mismo nombre es que al menos hay dos nombres, luego debe ser r<=1/2. D’Agostini ha calculado dicha probabilidad (sea z) mediante el cálculo (1 – r)/4 + r/4 + z = (1 – r)/2 («the sums along rows and columns have to be preserved«), lo que da el resultado de la tabla.

      1. Gracias a ti por tu incansable labor, Francis.

        Pero a D’Agostini no hay nada que agradecerle. Dice: «Note that the impossibility of identical children names constrains r to be smaller than 1/2…» ¿Cómo? ¿Por qué? Pero eso es secundario.

        Lo importante es que su análisis del _segundo_ problema está mal, y además por razones cuyo análisis puede resultar instructivo.

        Veamos: asumiendo la _independencia_ de los nombres elegidos para las hermanas, el primer problema está correctamente resuelto. La matriz de probabilidades resulta de multiplicar las probabilidades correspondientes a cada uno de los hermanos, y a partir de ella se obtiene el resultado que D’Agostini presenta.

        Pero es obvio que esta independencia no se da en el segundo problema entre los nombres de las hermanas: si hay dos niñas, el nombre de la segunda se ve restringido por el nombre de la primera.

        ¿Cómo aborda D’Agostini la solución? Muy sencillo: partimos de la solución del primer problema (porque sí, porque ya la tenemos, o vete a saber por qué) y la «renormalizamos» para que sea imposible que dos hermanas se llamen igual.

        Pero eso es completamente arbitrario. El segundo problema está indeterminado; hay que dar más datos para calcular la solución. No basta conocer r (referido a la probabilidad de una niña cualquiera), sino que hay que conocer, por ejemplo, r1 (probabilidad de que una primogénita se llame Paquita), r2 (probabilidad de que una segundogénita con hermano mayor varón se llame Paquita) y r3 (probabilidad de que una segundogénita con hermana mayor no Paquita se llame Paquita). D’Agostini supone que r1=r2=r, pero no tiene que ser así (y, de hecho, es imposible si r>1/2)

  2. Podéis ver otra vuelta de tuerca
    Tanya Khovanova, «Martin Gardner’s Mistake,» ArXiv, 1 Feb 2011 (aquí).
    Según esta señorita, ni siquiera es lícito decir que la solución a la tercera pregunta es 1/3.
    Además lo enfoca desde una «perspectiva de género»; qué hábil, ya ha encontrado un buen tema de tesis y subvención 🙂

Deja un comentario