Predicciones MotoGp campeon 125 y F1 constructores

En esta segunda entrada vamos a completar el análisis que comenzamos hace un par de días con las predicciones de la escudería campeona del mundo de F1 y del piloto ganador en 125.

En cuanto a el campeonato de marcas, haciendo la misma gráfica de la evolución de los puntos acumulados vemos que también ajustan bastante bien las predicciones y hay dos escuderías que aparecen como favoritas, Red Bull, en azul y McLaren, en verde.


Usando las ecuaciones de regresión podemos estimar los puntos finales de cada escudería, que para la carrera 19 serían:

RED BULL = 27.381 x 19 - 23.925 => Aprox = 496
McLAREN = 24.907 x 19 + 2.725 => Aprox = 476
FERRARI = 18.634 x 19 + 17.05 => Aprox = 371

Según estos modelos de regresión Red Bull ganaría el campeonato con 20 puntos de ventaja sobre McLaren que sería segundo. Ferrari estaría casi desestimado para la victoria final, ya que las previsiones son de 125 puntos menos que Red Bull, sin embargo las casas de apuestas ofrecen cuotas por su victoria, cosa altamente improbable como comprobamos en los resultados de la simulación:


Red Bull aparece como ganador en el 93.6% de los casos y McLaren en el 6.4% restante. Ferrari no aparece como ganador en NINGUNA de las 1000 simulaciones de las tres carreras restantes realizadas.

Conclusión: Tenemos a un equipo absolutamente favorito para ganar el mundial de marcas pero si observamos las cuotas (1,02 y 12 para Red Bull y Mclaren respectivamente en Bet365) vemos que no hay value en ninguna de ellas, por lo que no haremos ningún pick para este mundial.

Con esto acabamos con la Fórmula 1 y nos pasamos a las 2 ruedas donde el único campeonato que queda por dilucidar es el de 125 en el que 3 españoles se juegan el título, Márquez, Terol y Espargaró.

Según las rectas de regresión parece que Marc (azul) tiene una ligera ventaja sobre Nico (verde) y Pol (Rojo). Las predicciones de puntos finales para los tres son:


MARQUEZ = 18.431 x 17 - 9.6593 => Aprox 303
TEROL = 16.029 x 17 + 12 => Aprox 284
ESPARGARO = 15.864 x 17 + 10.736 => Aprox 280

Utilizando el mismo sistema de simulación que para la F1 obtenemos unos resultados más apretados:


Marc sigue apareciendo como el favorito, ganando en el 53.6% de las simulaciones, mientras que Terol lo hace en el 39%. Traduciendo estos porcentajes a cuotas esperadas tenemos un gran value en la cuota de Nico, ya que las casas ofrecen cuotas superiores a 4 por su victoria en el campeonato y uno ligeramente inferior en la de Pol (cuotas dispares, algunas superiores a 15).

Conclusión:

Nico Terol campeón del mundo de 125 @ 4.2 en Bet365 Pol Espargaró campeón del mundo de 125 @ 19 en PartyBet

En tres semanas volvemos con resultados.

Final temporada 2010 Formula 1

Estamos en la recta final del campeonato del mundo de F1 y con tres carreras todavía por disputar, todo parece indicar que el título de campeón del mundo es cosa de tres pilotos: Webber, Alonso y Vetel.

Durante todo el campeonato los Red Bull han sido muy competitivos y siempre se han clasificado en los primeros puestos de la parrilla aunque en las carreras sus resultados no han sido tan consistentes, sobretodo Vetel. Alonso, por su parte, comenzó muy bien, ganando en Bahrein pero a mitad de campeonato se produjo un bajón de rendimiento, aunque parece que en las últimas carreras la tendencia ha cambiado.

Haciendo una gráfica de la evolución de los puntos de cada piloto se pueden ver todas estas circunstancias. En azul tenemos la gráfica de Webber, en verde la de Vetel y en rojo la de Alonso. Las líneas continuas representan los puntos acumulados y las discontinuas son los ajustes.


En las cajas de colores vemos las ecuaciones de regresión y el coeficiente de determinación (R2), que es superior al 95% en todos los casos. Este coeficiente es una medida de la bondad de ajuste entre los datos y las estimaciones y en nuestro caso podemos decir que nuestros modelos de regresión se ajustan muy bien a los datos reales.

Así pues, según estos tres modelos las predicciones de puntos para el final del campeonato (carrera número 19) serán:

WEBBER = 14.84 x 19 - 19.575 => Aprox = 218
VETEL = 12.541 x 19 -4.35 => Aprox = 196
ALONSO = 11.446 x 19 + 4.4 => Aprox = 187

Según estos modelos de regresión Webber ganaría el campeonato con más de 20 puntos de ventaja sobre Vetel que sería segundo y 31 sobre Alonso que sería tercero.

Estas diferencias son mucho mayores que lo que reflejan las cuotas ofrecidas por las casas de apuestas. Bet365, por ejemplo ofrece Webber a 2.1, Vetel a 3.4 y Alonso a 3.75

Como ya hemos visto hay una relacción iversa entre cuota y probabilidad, el modelo de regresión no nos indica la probabilidad, nos da un valor aporximado, pero podemos hacer una estimación de la probabilidad mediante una simulación. Para ello lo que vamos a hacer es simular MIL resultados de las tres últimas carreras en función de los resultados que han obtenido los pilotos durante todo el campeonato. El resultado es el siguiente.

Webber nos sigue apareciendo como ganador en más del 75% de los casos, Alonso ha saltado al segundo lugar con casi un 15% y Vetel se queda rozando el 10%. Con estas probabilidades las cuotas esperadas serían de 1.33 para WEBBER, 6.71 para Alonso y 10.10 para Vetel.

Si repetimos la simulación con los resultados de las últimas 6 carreras, en las que Alonso ha conseguido sus mejores resultados. La cosa no cambia demasiado


Webber sigue siendo el ganador en el 62% de los casos y Alonso ha subido hasta más de un 28%, quedándose Vetel en prácticamente el mismo porcentaje.

Conclusión: Tenemos a un muy favorito en los tres analisis y comparando las probabilidades previstas con las cuotas ofrecidas da la impresión de que tenemos un value importante en Webber. Así que nuestro pick será:

WEBBER campeón del mundo de F1 @ 2.3 en Miapuesta

En el segundo análisis veremos lo que sucede con el mundial de constructores y el campeonato del mundo de 125 cc. Pero esto será dentro de un par de días.

Gazapos Estadisticos

Hay un blog, que probablemente muchos de vostros conozcais, y que a mi me hace mucha gracia. Es el claro ejemplo de como el uso cada vez más masivo de los ordenadores es en ocasiones contraproducente. Me estoy refiriendo a PsD (Photoshop Disasters). En el blog se dedican a resaltar casos en los que los resultados de los retoques distan mucho de ser profesionales. Así nos podemos encontrar piernas olvidadas encima de una roca, cabezas de alien anunciando lencería, o niños con cuatro manos, por citar solo algunos ejemplos.

En el campo de la estadistica sucede algo parecido, los ordenadores ponen al alcance de un clic cálculos, que hace unos años solo podían realizar los más avezados en la materia. Con ello proporcionan un arma terrorífica a personas que la única moda que conocen es la del Corte Inglés.

Así que voy a inaugurar una sección a la que llamaré Gazapos Estadísticos, para resaltar casos de este estilo. Y nuestra primera invitada va a ser Saray Marqués del períodico gratuito ADN.

Hace unos días publicaba en la edición en papel la siguiente noticia:


En la que se puede leer:
Se calcula que un 5% de los estudiantes españoles está por encima de la media
Esto me hirió sobremanera, porque yo no me considero dentro de ese 5%, con lo cual estoy en el 95% restante. Si sólo el 5% de todos los alumnos está por encima de la media, eso quiere decir dos cosas, que la media no sirve para nada (cosa que ya veremos con más detenimiento en otra entrada) y que ese 5% son unos superclase y el resto somos unos tontos de capirote. Mal panorama.

Cuando fui a comprobar la versión electrónica, alguien con un poco más de conocimiento debió advertir el error y propuso una modificación:

Esto es otra cosa, Saray, más vale una rectificación a tiempo a tener que padecer el capirote del 95% toda la vida.