Los Test de Hipotesis, el P-Value y Usain Bolt

Usaint
Hace algunos años, en este post, explicaba cómo se podía hacer un test de normalidad en Excel y en él hacía mención a lo que en estadística inferencial se llama el p-value. El p-value, como su propio nombre indica, es un 'valor' que se obtiene como resultado de un test de hipótesis, en el que se suele plantear una disyuntiva entre dos alternativas. 
Voy a intentar ser lo más elemental posible en este post para que se pueda entender de manera fácil. 
Imaginemos que lo que queremos analizar es si yo soy Usain Bolt o no. Para ello haremos un test en el que planteamos dos hipótesis:
  • La hipótesis nula (H0) sería que yo soy Usain Bolt
  • La hipótesis alternativa (H1) sería que no lo soy
 Ahora nuestro test de hipótesis lo que hace es: 
  • Vale, voy a darte el beneficio de la duda y vamos a partir de la base que SI lo eres. Ahora voy a usar mis métodos para intentar encontrar pruebas (diferencias) y dependiendo de lo grandes que sean esas diferencias te diré si deberías rechazar H0 o no.  ¡¡OJO!!, no digo aceptar, digo rechazar o no, la explicación a esto la veréis más abajo.
Bien, pues vamos con nuestro test que pretende encontrar esas diferencias. El test consiste en las siguientes 10 preguntas:
  1. ¿Eres hombre?
  2. ¿Eres negro?
  3. ¿Tienes dos piernas?
  4. ¿Has asistido alguna vez a unos juegos olímpicos?
  5. ¿Tienes hermanos?
  6. ¿De pequeño jugabas al futbol?
  7. ¿Te gustaría jugar en el Manchester United?
  8. ¿Te gusta la música?
  9. ¿Juegas al dominó?
  10. ¿Has corrido alguna vez la prueba de 1500 m?
 Las respuestas a esas preguntas si se las hiciésemos a Usain serían todo Sies menos la última que es un No.
Si me las hago a mí, la respuestas son todo sies menos la segunda y la última.
Es decir que el 90% de mis respuestas coinciden con las de Usain. Este test, no ha conseguido encontrar practicamente ninguna diferencia entre Usain y yo. Con estos resultados, el p-value que obtendríamos estaría bastante por encima del 0.05 que suele ser el valor de corte utilizado para rechazar o no la hipótesis nula.
A la vista de estos datos, MUCHA GENTE diría, como el p-value es mayor que 0.05 (lo que se denomina nivel de significación) aceptamos H0 como válida, lo que equivale a asegurar que SOY USAIN BOLT.
Lamento decepcionaros, pero evidentemente no lo soy.
Uy, pero entonces, ¿Que ha pasado?. Pues muy fácil, mi test es tan sumamente malo que no encontraría diferencias significativas entre cualquier hombre de este país y Usain Bolt. Así de sencillo.
Cuando obtenemos este tipo de resultados en un test de hipótesis, EN LUGAR DE ACEPTAR H0, lo que se DEBE DECIR es que no hemos encontrado diferencias suficientes para RECHAZAR H0 y lo que nos debemos plantear en este caso es si nuestro test es suficientemente potente como para encontrar esas diferencias. Como todos vosotros coincidiréis y viendo esta patata de test, la respuesta a la pregunta es un rotundo NO.
Cualquiera de vosotros puede encontrar otra batería de 10 preguntas, o de menos incluso, que permita identificar, con una certeza casi absoluta, si la persona que responde al test es o no es Usain Bolt. He de reconocer que me ha costado encontrar 10 preguntas para hacer el chapuza test este, buscando información sobre Usain hay miles de cosas que preguntar que nos distinguirían de inmediato entre uno y otro.
Como no quiero hacerlo muy largo, por hoy, lo dejamos aquí y en el siguiente post veremos la relación entre el p-value y las apuestas, que es algo que en Twitter está muy de moda.

0 Comentarios: