Fuentes de Datos

Antes de continuar con el curso básico de estadistica vamos a hacer un pequeño paréntesis para hablar de fuentes de datos y su tratamiento en Excel. Esto nos servirá como base para afrontar los temas a tratar en el apartado de estadística descriptiva. Lo que haremos es tomar datos de estas páginas y los utilizaremos para explicar los conceptos que iremos abordando en posteriores entradas.

Como ya hemos comentado, internet es una fuente de datos inagotable. A través de buscadores o foros podemos acceder a inumerables páginas en las que se nos facilita información de todo tipo. Las más comunes son las de resultados finales de partidos o carreras, pero también podemos encontrar otras en los que la información sobre el partido resulta mucho más detallada.

Trasladar estos datos a Excel puede ser una tarea sencilla o realmente complicada dependiendo de como aparezcan en la página. En este post de Forobet se explica como utilizar una función de Excel muy práctica para recopilar datos de una página web de manera rápida y fácil. Esto es realmente interesante para ir almacenando datos día a día, ya que la página a la que accedemos, cambia y se actualiza con los datos nuevos. Pero si lo que necesitamos es crear una base de datos con todos los partidos que se han jugado hasta hoy no podemos utilizar páginas de este tipo y debemos buscar otras en las que tengamos todos los datos en una única página. Hay que decir que este tipo de webs escasean bastante y yo solo he encontrado dos:

1. ShrpSports: Una página impresionante de resultados de deportes americanos (NBA, NHL, NFL...) con datos que se pueden filtrar por temporadas, equipos, o días de la semana entre muchos otros criterios.

2. Datos de la liga española de futbol: Pagina muy interesante con datos de partidos y resumenes de la liga española de futbol.

Dejaremos estas dos páginas en nuestros favoritos ya que son las que nos van a servir como fuente de datos para explicar los conceptos de los siguientes post. Hasta entonces, sed felices.

¿Game Over?

Hace algunos años, cuando empezaban a hacerse populares las famosas maquinitas de marcianitos, todos nos empezamos a familiarizar con dos palabras que aparecían siempre al final de la partida. GAME OVER. No habia que ser un lince, ni haber estudiado filología inglesa para saber que es lo que significaban. A mi, particularmente me daban bastante grima. Su aparición anunciaba el fin de la emoción y la diversión.

Algo parecido me ha sucedido cuando revisando las web que suelo visitar me he encontrado con un GAME OVER en uno de los blogs por los que paso. Todos estais al día de mis más y mis menos con el autor del blog, y como ya dije en su dia, no voy a hacer más comentarios tomate y este no va a ser el que rompa la norma. Este adios indefinido, que yo espero que sea un hasta luego, me ha entristecido y me ha devuelto a mis sentimientos de la infancia, frente a esa pantalla con las letras parpadeando.

A Anja lo conocí hace cosa de un año al hilo de un privado que me mandó un usuario de Forobet en el que me preguntaba si era yo, él me dió la dirección del blog y he de decir que una de las primeras entradas que leí, me sorprendió intelectualmente, cosa que me ocurre muy pocas veces, por desgracia. En ella planteaba un debate sobre las cuotas del primer juego ganado en tenis entre Federer y Nadal. Quién me iba a decir a mi que un año después un post con los mismos protagonistas, sería la base de otra de sus entradas, en un tono un poco diferente.

La forma de buscarle las cosquillas al bookie me gustó, y, dejando a parte el cálculo, el razonamiento era de lo más lógico. Me pareció muy brillante y muy distinto a todo lo que había leido hasta entonces. Así que empecé a pasarme por allí con más asiduidad. Habia planteamientos muy interesantes, comentarios sobre temas que desconocía por completo y entradas que pasaba por alto, las menos. Ultimamente las tornas se habían cambiado y las entradas que pasaba por alto eran la mayoría, basicamente porque tocaban temas que no me interesaban demasiado y en las que los comentarios eran realmente poco o nada interesantes.

Como ya le dije a él mismo en mas de una ocasión, sus brillantez y sabiduría quedaban oscurecidos por sus maneras en sus comentarios y entradas. Cada uno es libre de comportarse como le plazca y no voy a ser yo quien imponga las normas de comportamiento. Si el consideraba oportuno esta manera de proceder, pues estaba en todo su derecho. Como bien decía, él era el creador del blog y al que no le guste que no lo lea.

Anja, como ya te he dicho, espero que no sea un adios definitivo y te volvamos a ver, bien por tu blog o bien por otros blogs o foros. Sabes que en este, tanto tus comentarios como tus aportaciones, serán siempre bien recibidas. Te dejo con tu 'amigo' Kasparov que se que te hará ilusión, él, como bien sabrás le ganó a la máquina, espero que tu hagas lo mismo porque no me quiero quedar con esa sensación del GAME OVER en la pantalla y buscando la ranura por todos los lados para meter otros cinco duros.

Los Sucesos: Definición y Clases

Para introducirnos en el mundo de los sucesos haremos una breve parada en los espacios muestrales y sus conclusiones. Entenderemos por espacio muestral al conjunto de todos los posibles resultados individuales de un experimento aleatorio. Este experimento aleatorio lo definiremos como aquél que bajo el mismo conjunto de condiciones iniciales, puede presentar resultados diferentes, es decir, no se puede predecir el resultado de cada experiencia particular.

El ejemplo más claro es el lanzamiento de una moneda o de un dado. Al espacio muestral se le suele denominar "E" y se entiende por punto muestral cada uno de los elementos que lo forman. En nuestros dos ejemplos básicos sería:

Lanzar una moneda => E = {cara,cruz}
Lanzar un dado => E = {1,2,3,4,5,6}

------------------------ X ------------------------


Tras esta pequeña introducción pasamos a la definición de suceso. Se llama suceso de un experimento aleatorio a cada uno de los subconjuntos del espacio muestral "E". El conjunto de todos los sucesos de un experimento aleatorio se conoce como espacio de sucesos y se representa por "S".

Ante este atropello de definiciones podemos llegar a pensar que suceso y punto muestral es lo mismo, pero realmente no lo es. Un ejemplo claro lo podemos ver con el lanzamiento del dado, un suceso sería por ejemplo que salga número par, para lo cuál no servirían los puntos muestrales [2,4,6]. De ahí las diferencias entre unos y otros.

En la práctica sobre cada espacio muestral, asociaremos un espacio de sucesos. Como ejemplo para lanzar una moneda al aire, tendremos el siguiente cuadro:

E= {Cara, Cruz}
S= {{Ø}, {Cara}, {Cruz}, {Cara,Cruz}}

Llevado prácticamente al mundo de nuestras apuestas, consideremos el partido de la final pasada de Wimbledon que enfrentó a Roger Federer y Rafael Nadal. El esquema sería:

E= {Federer, Nadal}
S= {{No Gana Nadie}, {Federer}, {Nadal}, {Ganan Ambos}}

De este ejemplo sacaremos los diferentes tipos de sucesos que se nos pueden presentar:
  1. Suceso Elemental: aquéllos formados por un único punto muestral.
  2. Suceso Compuesto: aquéllos formados por dos o más puntos muestrales.
  3. Suceso cierto o seguro: el que siempre se realiza, es decir, coincide con el espacio muestral y estará formado por todos los resultados posibles del experimento.
  4. Suceso Imposible: se designa por "Ø" y es aquél que no se realiza nunca. En nuestro espacio de sucesos siempre aparecerán el suceso cierto y el imposible.
  5. Suceso Contrario: dado un suceso cualquiera A del espacio de sucesos S, se denomina suceso contrario del suceso A al suceso que se realiza cuando no se realiza A y recíprocamente. Se designa por à o A'. El conjunto A' está formado por los puntos muestrales de E que no pertenecen a A.
Por tanto, el suceso contrario del suceso cierto es el imposible y viceversa:

E'=Ø → Ø'=E

Para terminar la entrada, parafrasearemos al matemático francés Henri Poncaré (1854-1917) cuya foto hemos dejado en la mitad del texto, que dijo: "El azar es la medida de nuestra ignorancia", dándonos a entender que en los fenómenos en los que interviene el azar no podermos predecir su resultado de antemano, pero intentaremos limitar los resultados.