Modelo de prediccion de resultados de un partido de Futbol (Paso2)

En primer lugar quiero agradecer a todos los que han colaborado con las sugerencias el tiempo que me han dedicado enviado los factores que para ellos eran importantes. Ya hemos recogido unos cuantos y podemos empezar a comentarlo.

Empezamos por orden de importancia en cuanto a la cantidad de sugerencias recibidas:

 1. Goles: Ha sido el factor más votado y es el más fácil de conseguir, con lo que tiene todo para ser considerado como uno de los principales en el modelo de predicción. En algunos casos no se especifica claramente, pero tomaremos los goles a favor, y en contra de los dos equipos.

2. Bajas: El segundo factor más votado han sido las bajas. Este ya tiene un poco más de dificultad porque los modelos deben incluir parámetros transversales, es decir, que sean cuantificables en todo el conjunto de datos que tengamos para ajustar el modelo y para predecir. Así que deberemos traducir el factor BAJAS a algo valorable en cada equipo, relacionado con las alineaciones. Se me ocurre algo parecido a los puntos que tiene cada cromo de la liga, o bien puntos o euros que cuesta cada jugador en Comunio, o algo similar. Un sistema de puntuacion similar al de Fanaticleague sería ideal. Se aceptan sugerencias también para esto.



3. Arbitro: No ha sido mayoritaria pero algunos de vosotros ha considerado que esta variable también debe ser incluida en el modelo. En este caso pasa algo similar a lo que hemos comentado con las bajas, hay que cuantificar también. Podría ser el % de partidos ganados empatados y perdidos del equipo de casa cuando pita un determinado colegiado y lo mismo para el de fuera. Aceptamos, por supuesto, otras sugerencias.

4. Clima: Otro factor dificilmente cuantificable, al que incluso podríamos añadir hora del partido (mañana / tarde / noche).  Mi propuesta sería hacer algo similar al caso del arbitro, % de partidos ganados / empatados / perdidos.

Con estos factores acabamos la entrada de hoy, en la siguiente continuaremos con los que quedan, pero antes me gustaría proponer algunos más que curiosamente no han recibido ningún voto:

  • Distancia recorrida por el equipo visitante. Hay estudios que indican que hay una relacion entre victorias visitantes / locales dependiendo de las distancias recorridas por el equipo visitante.
  • Estrategia / Esquema de juego de cada equipo. 
  • Ponderación de partidos o goles en función de la fortaleza del equipo contra el que se ha jugado (algo similar al rating ELO de los jugadores de ajedrez), es decir, no es lo mismo haber jugado 5 partidos contra los últimos equipos de la liga que contra los primeros. 
Un saludo y sigo atento a vuestras sugerencias.

2 Comentarios:

Anónimo dijo...

curioso q haya sido mas votado las "bajas" que las "altas"

Me aprece mas importante quien juega a quien no juega

Buzjss dijo...

Supongo que no se referirian únicamente al tema de bajas, sino a la plantilla que juega el partido. En cuanto a si es más importante quien juega o quien no, es discutible:

http://buzjss.blogspot.com.es/2009/12/la-cristianodependencia-del-real-madrid.html

Un saludo y gracias por tu opinion.