Fuentes de Datos

Antes de continuar con el curso básico de estadistica vamos a hacer un pequeño paréntesis para hablar de fuentes de datos y su tratamiento en Excel. Esto nos servirá como base para afrontar los temas a tratar en el apartado de estadística descriptiva. Lo que haremos es tomar datos de estas páginas y los utilizaremos para explicar los conceptos que iremos abordando en posteriores entradas.

Como ya hemos comentado, internet es una fuente de datos inagotable. A través de buscadores o foros podemos acceder a inumerables páginas en las que se nos facilita información de todo tipo. Las más comunes son las de resultados finales de partidos o carreras, pero también podemos encontrar otras en los que la información sobre el partido resulta mucho más detallada.

Trasladar estos datos a Excel puede ser una tarea sencilla o realmente complicada dependiendo de como aparezcan en la página. En este post de Forobet se explica como utilizar una función de Excel muy práctica para recopilar datos de una página web de manera rápida y fácil. Esto es realmente interesante para ir almacenando datos día a día, ya que la página a la que accedemos, cambia y se actualiza con los datos nuevos. Pero si lo que necesitamos es crear una base de datos con todos los partidos que se han jugado hasta hoy no podemos utilizar páginas de este tipo y debemos buscar otras en las que tengamos todos los datos en una única página. Hay que decir que este tipo de webs escasean bastante y yo solo he encontrado dos:

1. ShrpSports: Una página impresionante de resultados de deportes americanos (NBA, NHL, NFL...) con datos que se pueden filtrar por temporadas, equipos, o días de la semana entre muchos otros criterios.

2. Datos de la liga española de futbol: Pagina muy interesante con datos de partidos y resumenes de la liga española de futbol.

Dejaremos estas dos páginas en nuestros favoritos ya que son las que nos van a servir como fuente de datos para explicar los conceptos de los siguientes post. Hasta entonces, sed felices.

0 Comentarios: