En el fútbol, ¿gana siempre el mejor equipo? (o Bundesliga, matemáticas y series temporales)

Por Francisco R. Villatoro, el 7 marzo, 2008. Categoría(s): Ciencia • Matemáticas
forces acting on a curving soccer ball

 Entre físicos y matemáticos también los hay aficionados al fútbol, el deporte rey, no sólo en España, sino también en Alemania. El artículo de Andreas Heuer and Oliver Rubner, «Fitness, chance, and myths: an objective view on soccer results,» ArXiv, 5 March 2008, estudia los resultados de partidos de fútbol de la Bundesliga desde el punto de vista de la teoría de series temporales. Quieren responder a preguntas como ¿es el campeón siempre el mejor equipo? ¿cuántos partidos se han de jugar en la liga para que «casi» siempre el mejor equipo sea el campeón?

Claro, lo primero es saber ¿cómo se determina cuál es el mejor equipo? Los autores han estudiado 12546 partidos de la Bundesliga entre las temporadas de 1965/66 hasta 2006/07 (tomados de aquí). El promedio de goles por partido es de 3.1 con un descenso en los últimos 20 años a 2.8. Un equipo gana 3 puntos si vence, 1 si empata y 0 si pierde. En la Bundesliga hay 18 equipos con lo que una temporada son N=34 partidos.

Como posibles medidas de calidad, los autores del estudio analizan el número de puntos P y la diferencia entre el número de goles marcados (Gm) y el número de goles recibidos (Gr), sea DG=Gm-Gr. Como la «calidad» de un equipo debería ser un parámetro «propio» del equipo y mantenerse constante entre la primera mitad de la temporada y la segunda mitad, han estudiado el coeficiente de correlación de Pearson (cp) entre los parámetros P, Gm, Gr y DG calculados en los primeros 17 partidos y en los 17 restantes. Un buen equipo lo hará bien en ambos casos. Los autores han mostrado que G tienen un mejor cp (0.58) que P (0.49), Gm (0.49) y Gr (0.46), por lo que parece una mejor medida de la «calidad». La correlación entre la DG (para toda la temporada) y la P (final) es «buena». ¿Se mantiene DG constante durante la temporada? Han estudiado cómo evoluciona durante la temporada, dividiendo ésta en 4 partes (9, 8, 9, y 8 partidos), observando que su valor se mantiene «bastante» constante, mucho mejor correlacionados que en una comparación entre sus valores para temporadas diferentes.

Obviamente, el número de goles en un partido concreto entre dos equipos depende de muchos factores «no predecibles», incluyendo la suerte. Por ello, el resultado de un partido tiene una fuerte componente estadística, sin embargo, la varianza de esta componente no depende del valor de DG, y decrece cuando el número de partidos por temporada N crece (para N grande, la varianza decrece como 1/N). Sin embargo, para 18 equipos hay sólo N=34 partidos, con lo que la contribución estadística de la componente aleatoria en el resultado es importante (superior al 30% en la varianza). De ahí que no sea fácil acertar las quinielas. La suerte es un factor importante.

¿Es cierto que el equipo 1 con mayor «calidad», DG1 > DG2, es «mejor» que el equipo 2? Los datos muestran que DG1-DG2=0.35 (unos 12 goles de diferencia tras 34 partidos) aún permiten que el «mejor» equipo sea el que tiene menor DG2 incluso hasta un 24% de las veces. Los autores lo justifican debido a que N es pequeño y no como un desmérito a su medida de «calidad».

Utilizando DG como métrica, analizan tres mitos del fútbol.

¿Realmente hay equipos más fuertes en casa (o fuera de casa)? Es decir, ¿la «calidad» DG de un equipo determina su «calidad» en casa DGC (o fuera DGF)? Los datos históricos utilizados no soportan este «mito». En media, los equipos se comportan igual en casa y fuera de casa, tanto si son de «calidad» alta como baja.

¿Hay equipos «buenos» porque tienen mejor delantera y peor defensa (o con mejor defensa y peor delantera)? Sorprendentemente los datos históricos tampoco soportan esta opinión, tan común en el mundo del fútbol. Los de calidad «alta» tienen tanto buena defensa como buena delantera.  

¿Que un equipo gane (o pierda) muchos partidos seguidos refuerza (o reduce) las posibilidades de ganar en el próximo partido? Sólo en el caso de pérdida se ha confirmado este efecto, aunque es bastante pequeño. El coeficiente DG de un equipo que ha perdido muchas veces baja un poco si se le compara con su nivel normal. El efecto positivo parece que no ha sido observado en los resultados experimentales.

En resumen, un artículo que introduce una «métrica de calidad» de un equipo de fútbol, que, como cualquier medida que reduce los comportamientos humanos a un sólo número, es muy discutible, pero que los autores utilizan para analizar ciertos mitos del fútbol y les permite obtener ciertas sorpresas.

¿Es el campeón siempre el mejor equipo? No, ya que 34 partidos por temporada son «pocos» y la componente aleatoria (suerte) en los partidos es muy grande (varianza superior al 30%).

¿Cuántos partidos se han de jugar en la liga para que «casi» siempre el mejor equipo sea el campeón? La varianza siempre es mayor del 20%, incluso jugando «infinitos» partidos (extrapolando los resultados para 1/N=0), luego es imposible evitar que en muchos casos el «mejor» equipo no sea el campeón.

Acertar la quiniela seguirá siendo una «alegría» para todos.



0 Comentarios

  1. Yo he comprobado que es cierto que la variable suerte es de un 35%, pero tb baja al tener mas porcentaje de ganar el mejor equipo. Además si a eso le sumamos la variable de paartidos seguidos ganados en casa (en caso de que fuera en casa del mejor equipo), la variable suerte disminuye. En todo caso, no veo que se comente nada de la variable bajas, la cual es muchas veces un factor determinante. Tb creo que hay una variable que no tienen en cuenta, puesto que se centran mucho en el futbol, en realidad son dos variables: el impacto social y los intereses economicos del futbol, lo cual puede llegar a disminuir aun mas la variable suerte.

Deja un comentario