
La
distribución de Poisson lleva el nombre de su descubridor que la publicó en 1838, junto con su teoría de probabilidad en su trabajo
Recherches sur la probabilité des jugements en matières criminelles et matière civile ("Investigación sobre la probabilidad de los juicios en materias criminales y civiles"). En un primer momento, la utilizó para predecir el resultado de las votaciones de los jurados en un veredicto. A partir de ahí, su uso se extendió a la ciencia de la artillería y actualmente se usa en multitud de situaciones, como, número de fallos en un proceso productivo, cantidad de llamadas telefonicas recibidas en un periodo de tiempo, número de bacterias en un especímen determinado, cantidad de estrellas en un volumen de espacio, numero de mails recibidos al dia, número de goles marcados en un período de un partido de la NHL e incluso, en 1898, se utilizó para determinar la probabilidad de que un soldado del ejército Prusiano muriese a consecuencia de la coz de su caballo.
La distribución de Poisson es una distribución se utiliza para modelizar eventos discretos. Eventos en los que sus resultados solo pueden ser números enteros mayores o iguales a 0. En un partido de fútbol no se pueden marcar 3.2 goles ni en una hora se pueden recibir 12.7 llamadas por teléfono. Esto no quiere decir que un equipo no pueda marcar una media de 3.2 goles por partido y una operadora no pueda recibir una media de 12.7 llamadas a la hora. Son dos cosas diferentes, una es el resultado de un determinado evento (un partido de futbol), que siempre será un número entero mayor o igual a 0, y otra la media de los resultados individuales. No se deben confundir.
Se ha demostrado estadísticamente que
la distribución de Poisson se ajusta relativamente bien para predecir el número de goles marcados en partidos de hockey. En el caso del
fútbol el ajuste empeora un poco y muchos autores indican que para mejorar sus predicciones se debe realizar una corrección para resultados de 0 goles e incluso de 1 gol. Para este ejemplo nosotros utilizaremos la distribución sin ningún tipo de ajuste.
Su fórmula es la siguiente:
Prob(B=k) = exp (-m) x m^k / k!
Siendo m la media y k el número de eventos sobre los que estamos calculando la probabilidad. Y esta ecuación se lee como la probabilidad de que aparezcan k sucesos en un evento con media de apariciones m.
Veamos un ejemplo:
Supongamos que el Botijos F.C. ha jugado 20 partidos y ha marcado 28 goles. ¿Que probabilidad hay de que en el siguiente partido marque exactamente 1 gol?La media de goles por partido es de 28 / 20 = 1,4 goles por partidoAhora tenemos dos alternativas:
1. Ir al excel y colocar =Poisson(1;1,4;Falso)= 0.345 (esta función es para el Excel en castellano para los que tengan la configuración en ingles, el paréntesis quedaría, (1,1.4,False))
2. P(B=1) = exp (-1.4) x 1.4^1 / 1! = exp (-1.4) x 1.4 = 0.345
Es decir la probabilidad de que el Botijos FC marque un gol es de 34.5%
Si lo que queremos saber es la probabilidad de que el Botijos meta al menos un gol. También se puede hacer por dos caminos, pero voy a usar el excel que es el más rápido. Para hacerlo debemos usar el suceso complementario. No voy a explicar esto ahora porque me llevaría una buena parrafada, pero es así:
P(B>=1) = 1 - P(B=0)
P(B>=1) = 1 - Poisson(0;1,4;Falso) = 1 - 0.25 = 0.75 = 75%
Veamos ahora su aplicación al resultado de un partido.
¿Que probabilidad hay de que el partido sea under 1.5 si juega contra el Chinchorro FC, sabiendo que marca 2 goles por partido de promedio?Para calcular esto, lo primero que debemos hacer es obtener el conjunto de resultados que cumplen en under 1.5. Son 3:
0-0, 0-1, 1-0
Calculamos ahora la probabilidad de cada uno de ellos y la probabilidad del under será la suma de todos ellos.
P(B=0, C=0) = Probabilidad de que el Botijos marque 0 goles x Probabilidad de que el Chinchorro marque 0 goles = Poisson(0;1,4;Falso) x Poisson (0;2;Falso) = 0.25 x 0.135 = 0.033
Es decir la probabilidad del 0-0 es de un 3.3%
P(B=0, C=1) = Poisson(0;1,4;Falso) x Poisson (1;2;Falso) = 0.25 x 0.41 = 0.1
P(B=1, C=0) = Poisson(1;1,4;Falso) x Poisson (0;2;Falso) = 0.59 x 0.135 = 0.08
P(Under 1.5) = 0.033 + 0.1 + 0.08 = 0.213 = 21.3%
Aplicando el mismo razonamiento del suceso complementario tendríamos que la probabilidad del over 1.5 sería de 1-0.213 = 0.787 = 78.7%
Siguiendo este mismo procedimiento se pueden modelizar todos los posibles resultados del partido para determinar, probabilidades de que gane el equipo de casa, empate, gana el equipo de fuera e incluso calcular la probabilidad de otras líneas de Over/Under, como la 2.5.
Solo un apunte final, en estos casos se suele calcular la probabilidad del resultado individual de 0, 1, 2, 3, 4, 5 y más de 5 goles. Para calcular esta última se hace también por el suceso complementario
P(B>5)= 1 - P(B<=5) y la P(B<=5) se calcula en excel de forma muy sencilla:
P(B<=5) = Poisson (5; media; VERDADERO)
El verdadero de la última parte de la fórmula indica que es una probabilidad acumulada, de 0 hasta 5. Justo lo que necesitamos.
Con esto acabamos este pequeño inciso sobre la distribución de Poisson. En diferentes entradas del curso básico analizaremos un poco más en profundidad algunos conceptos de esta entrada y veremos también otro tipo de distribuciones muy utilizadas como puede ser la distribución normal. Hasta entonces un saludo.
EDITO 22/07/10: Al final he encontrado una forma de añadir hojas de cálculo al blog y he creado una mini hoja Excel para calcular los resultados de un partido de Futbol a partir de la media de goles marcados por cada equipo. La hoja la teneís
aqui.