Bueno, como comentaba en la anterior entrada, vamos con esta segunda parte en la que seguiremos hablando de los test de hipótesis y el P-Value, pero ahora centrado en el tema de las apuestas, que es el motivo por el que me planteé escribir estos dos post.
Ya vimos en la entrada inicial, que el P-Value se obtenía como resultado de un test de hipótesis con el que valorábamos las diferencias encontradas entre DOS variables. El P-Value nos da una indicación sobre la probabilidad de que esas diferencias que hemos encontrado al hacer el test sean reales o sean fruto del azar. Si las diferencias encontradas son muy grandes, el P-Value será muy pequeño y, por tanto, nos está indicando que la probabilidad de que esas diferencias sean fruto del azar es muy baja.
Hay una gran variedad de test de hipótesis y cada uno de ellos se debe usar en función de las variables o los datos que tengamos que comparar. Podemos usarlos para comparar si el cambio de entrenador en el Real Madrid ha influido en la cantidad de goles que anota y que recibe el equipo, como hicimos en este post, o si el rendimiento de un bateador de la MLB podría estar afectado por el color de sus ojos, o si el Real Madrid, en su época, tenía una cristiano-dependencia. En todos ellos los test de hipótesis se usaron para comparar dos situaciones diferentes y concluir si las diferencias entre ellas eran estadisticamente significativas o no. En algunos casos vimos que SI, que había unas diferencias importantes y los P-Value que obteníamos eran muy bajos, con lo que SI podíamos decir que, con un grado de confianza del 95%, esas dos situaciones eran diferentes, pero en otros casos no encontramos diferencias lo suficientemente importantes.
Lo mismo nos pasaba en la entrada anterior, donde hice el supertest UsainBoltiano y me comparaba con velocista jamaicano. El test prácticamente no encontró ninguna diferencia entre Usain y yo. Cuando pasa esto, NO PODEMOS DECIR que esas dos variables que comparamos sean IGUALES, es decir, no podíamos decir que yo soy Usain Bolt, y debemos decir que no hemos encontrado diferencias suficientes para poder asegurar que son distintas. En estas circunstancias, nuestro siguiente paso seria valorar la 'potencia de nuestro test'. Debemos confirmar, si nuestro test es lo suficientemente potente como para encontrar las diferencias que estamos buscando.
Este es el primer problema de los test de hipotesis, que SIEMPRE comparan algo para buscar diferencias, y si no se encuentran esas diferencias, tenemos que confirmar si no las hemos encontrado porque en realidad no las hay o no las hemos encontrado porque nuestro test era una castaña (como asi era en el test de Usain Bolt).
El segundo problema de los test de hipótesis es SABER QUÉ COMPARAMOS. Y aquí es donde entra el tema de las apuestas.
Hace unos meses me topé con un post en Twitter, que me dejó un poco mosca, en el que un tipster hablaba de sus resultados y del P-Value. Y el remate final fue cuando vi este mensaje de la gente de Pyckio. En ese momento, me quede como un conejo cuando le dan las largas. Hacian un reto contra uno de sus mejores tipsters en el que el ganador se iba a valorar en función del P-Value.
Me puse a investigar y descubrí que hay un fichero Excel creado por Miguel Figueres que introduciendo 4 datos te devuelve un P-Value. Este P-Value traducido al lenguaje apuestil representa la probabilidad de que los resultados de tu estrategia de picks se deba al azar. Fascinante!!!!.
Pues manos a la obra, voy a meter mis datos a ver que pasa, 975 apuestas, Yield de 0.5, Promedio ponderado de apuestas 3,5 y stake medio 1:
Le doy al enter.... y tras unos segundos de tensa espera, aquí tengo mi resultado:
P-VAlue de 0,000%, eso no lo supera ni el super tipster de Pyckio,
soy un TOTAL PRO!!!. Con estos datos estoy seguro que la gran mayoría de vosotros seguiríais mis picks a ciegas.
Pues craso error. Esos picks han sido, 974 apuestas a cuota 2 con stake 1 en la que
solo he acertado UNA!!! y, como ya estaba hasta las narices de perder, tras 974 apuestas hice la apuesta 975, que fue una megacombinada a cuota 1500 y me tocó la lotería, como
al finlandés con el podio de la F1 en Monza hace unos dias. Mas azar que esto no puede haber en una estrategia de apuestas, y sin embargo el resultado de los cálculos de fichero me dice que NO, que mis resultados no pueden ser por suerte. ¿Como se explica esto?.
Pues muy fácil, el test que hace el fichero es un test en el que se comparan los resultados de mis apuestas con una función que podemos llamar apuestas medias ponderadas, en mi caso, los resultados de mis apuestas no se parecen ni por lo más remoto a esa función, con lo que el P-Value es enano. ¿Quiere decir eso que mis resultados no han sido fruto de la casualidad?, PUES NO, NO y MIL QUINIENTAS VECES NO. Lo que quiere decir es que los resultados de mis apuestas no se parecen en nada a la función con la que lo comparo y punto.
Así que sintiéndolo mucho, por ahora no he encontrado a nadie que tenga la varita mágica del P-Value en las apuestas, sencilla y llanamente porque NO SE PUEDE MODELIZAR LOS RESULTADOS DE LA FUNCION AZAR que serían los que tendríamos que comparar con nuestras apuestas.
Podría haber un caso en el que se podría hacer algo pero eso lo dejo para otro post, si a alguno de vosotros os interesa.