La prueba t de una muestra
¿Qué es la prueba t de una muestra?
La prueba t de una muestra es una prueba de hipótesis estadística que se usa para establecer si la media poblacional desconocida es diferente de un valor específico.
¿Cuándo puedo usar esta prueba?
Puede usar esta prueba en datos continuos. Sus datos deben ser una muestra aleatoria de una población normal.
¿Y si mis datos no tienen una distribución próxima a la normal?
Si los tamaños de sus muestras son muy pequeños, es posible que no pueda hacer la prueba de normalidad. Puede que deba basarse en su comprensión de los datos. Si no puede suponer normalidad de forma segura, puede efectuar una prueba no paramétrica que no asume la normalidad.
Uso de la prueba t de una muestra.
En las secciones a continuación comentamos qué necesitamos para efectuar la prueba, cómo comprobar nuestros datos, cómo llevar a cabo la prueba, comprender sus resultados y detalles estadísticos.
¿Qué necesito?
Para la prueba t de una muestra, necesitamos una variable.
También tenemos la idea, o hipótesis, de que la media poblacional tiene cierto valor. He aquí dos ejemplos:
- Un hospital toma una muestra aleatoria de medidas de colesterol en hombres. Estos pacientes están atendidos por problemas distintos al colesterol. No están bajo medicación por colesterol alto. El hospital pretende averiguar si la media poblacional desconocida de colesterol de sus pacientes es distinta del nivel objetivo de 200 mg.
- Medimos los gramos de proteínas en una muestra de barritas energéticas. La etiqueta declara que las barritas tienen 20 gramos de proteína. Queremos averiguar si esto es correcto o no.
Suposiciones de la prueba t de una muestra
Para realizar una prueba válida necesitamos valores que sean:
- Independientes (los valores no guardan relación entre sí).
- Continuos.
- Obtenidos de una muestra aleatoria de la población.
Además se asume que la población tiene distribución normal.
Ejemplo de prueba t de una muestra
Imaginemos que tenemos una muestra aleatoria de 31 barritas energéticas de diferentes tiendas para representar al conjunto de barritas energéticas disponibles para el consumidor general. Las etiquetas de estas barritas sostienen que cada una contiene 20 gramos de proteínas.
Tabla 1: Gramos de proteína en una muestra aleatoria de barritas energéticas
Barrita energética - Gramos de proteína | ||||||
---|---|---|---|---|---|---|
20,70 | 27,46 | 22,15 | 19,85 | 21,29 | 24,75 | |
20,75 | 22,91 | 25,34 | 20,33 | 21,54 | 21,08 | |
22,14 | 19,56 | 21,10 | 18,04 | 24,12 | 19,95 | |
19,72 | 18,28 | 16,26 | 17,46 | 20,53 | 22,12 | |
25,06 | 22,44 | 19,08 | 19,88 | 21,39 | 22,33 | 25,79 |
Si observa la tabla de arriba verá que algunas barritas tienen menos de 20 gramos de proteínas. Otras tienen más. Podría suponer que los datos apoyan la idea de que las etiquetas son correctas. Otros podrían discrepar. La prueba estadística ofrece un método robusto para tomar la decisión, de manera que todas las personas tomen la misma decisión partiendo del mismo conjunto de datos.
Comprobar los datos
Vamos a empezar por responder lo siguiente: ¿Es la prueba tde una muestra un método adecuado para evaluar si estas barritas tienen 20 gramos de proteínas? La siguiente lista repasa los requisitos de la prueba.
- Los valores de datos son independientes. Los gramos de proteínas de una barrita no dependen de los de ninguna otra. Un ejemplo de valores dependientes sería si reuniéramos barritas de un mismo lote de producción. Una muestra de un mismo lote es representativa de dicho lote, no de las barritas energéticas en general.
- Los valores de datos son gramos de proteína. Las medidas son continuas.
- Asumimos que las barritas suponen una única muestra aleatoria de la población de barritas energéticas disponibles para el consumo general (por ejemplo, una mezcla de multitud de barritas).
- Asumimos que la población de la que estamos tomando la muestra tiene una distribución normal, y para muestras grandes podemos comprobar dicha suposición.
Decidimos que la prueba t es un método adecuado.
Antes de pasar al análisis, debemos echar un vistazo rápido a los datos. En la siguiente figura se muestran histogramas y estadísticas de resumen de las barritas energéticas.
Con un vistazo al histograma podemos ver que no hay puntos extraños o valores atípicos. Los datos tienen aproximadamente forma de campana, así que nuestra idea de una distribución normal parece razonable.
De un vistazo a las estadísticas, vemos que la media es de 21,40, superior a 20. ¿Significa esto que la media de nuestra muestra de 31 barritas invalida el mensaje de la etiqueta de que la media poblacional desconocida es de 20 gramos de proteínas? ¿O no?
Cómo efectuar la prueba t de una muestra
Para los cálculos de la prueba t necesitamos la media, la desviación estándar y el tamaño muestral. Estos se indican en las estadísticas de resumen de la figura 1 anterior.
Redondeamos las estadísticas al segundo decimal. A menudo el software mostrará más decimales y los usará en los cálculos. (Tenga en cuenta que la tabla 1 solo muestra dos posiciones decimales; los datos reales usados para calcular la estadística de resumen tienen más).
Empezamos hallando la diferencia entre la media de la muestra y 20:
$ 21,40-20\ =\ 1,40 $
A continuación calculamos el error estándar de la media. El cálculo es:
Error estándar de la media = $ \frac{s}{\sqrt{n}}= \frac{2.54}{\sqrt{31}}=0,456 $
Esto encaja con el valor de la figura 1 más arriba.
Ahora tenemos las piezas para nuestra estadística de prueba. Calculamos la estadística de nuestra prueba así:
$ t = \frac{\text{Diferencia}}{\text{Error estándar}}= \frac{1.40}{0.456}=3,07 $
Para tomar nuestra decisión, comparamos la estadística de la prueba con un valor de la distribución t. Esta actividad tiene cuatro fases:
- Calculamos una estadística de prueba. Nuestra estadística de prueba es de 3,07.
- Decidimos el riesgo que estamos dispuestos a asumir por declarar una diferencia donde no la hay. Para el caso de las barritas energéticas, decidimos asumir un riesgo del 5 % de declarar que la media poblacional desconocida es distinta de 20 cuando no lo es. En términos de estadística, definimos α = 0,05. En la práctica, establecer el nivel de riesgo (α) debe hacerse antes de la toma de datos.
Hallamos el valor de la distribución t en función de nuestra decisión. Para una prueba t, necesitamos los grados de libertad para hallar dicho valor. Los grados de libertad se basan en el tamaño muestral. Para los datos de las barritas energéticas:
grados de libertad = $ n - 1 = 31 - 1 = 30 $
El valor crítico de t con un α = 0,05 y 30 grados de libertad es +/- 2,043. En la mayor parte de libros de estadística hay tablas de distribución que se pueden consultar. También se pueden encontrar en línea. La situación más probable es utilizar software y no tablas impresas.
Comparamos el valor de nuestra estadística (3,07) con el valor t. Puesto que 3,07 > 2,043, rechazamos la hipótesis nula de que la media de gramos de proteínas es igual a 20. Llegamos a la conclusión práctica de que las etiquetas son incorrectas, y la media poblacional desconocida de gramos de proteínas es mayor que 20.
Detalles estadísticos
Repasemos los datos sobre las barritas energéticas y la prueba t de ejemplo en términos estadísticos.
Nuestra hipótesis nula es que la media poblacional subyacente es igual a 20. La hipótesis nula se escribe así:
$ H_o: \mathrm{\mu} = 20 $
La hipótesis alternativa es que la media poblacional subyacente es distinta de 20. Las etiquetas que sostienen contenidos de 20 gramos de proteínas serían incorrectas. Esto se expresa así:
$ H_a: \mathrm{\mu} ≠ 20 $
Esta es una prueba bilateral. Estamos comprobando si la media poblacional es distinta de 20 gramos en una u otra dirección. Si podemos rechazar la hipótesis nula de que la media es igual a 20 gramos, podemos llegar a la conclusión práctica de que las etiquetas de las barritas son incorrectas. Si no podemos rechazar la hipótesis nula, entonces llegamos a la conclusión de que las etiquetas de las barritas pueden ser correctas.
Calculamos la media de la muestra y luego la diferencia con la media poblacional, mu:
$ \overline{x} - \mathrm{\mu} $
Calculamos el error estándar así:
$ \frac{s}{ \sqrt{n}} $
La fórmula representa la desviación estándar como sd y el tamaño muestral como n.
La estadística de la prueba emplea la siguiente fórmula:
$ \dfrac{\overline{x} - \mathrm{\mu}} {s / \sqrt{n}} $
Comparamos la estadística de la prueba con un valor t, con nuestro valor alfa elegido y los grados de libertad de nuestros datos. Utilizando como ejemplo los datos de las barritas, establecemos α = 0,05. Los grados de libertad (gl) se basan en los tamaños de los grupos, y se calculan así:
$ gl = n - 1 = 31 - 1 = 30 $
Los estadísticos escriben el valor de t con α = 0,05 y 30 grados de libertad como:
$ t_{0.05,30} $
El valor t de una prueba bilateral con α = 0,05 y 30 grados de libertad es +/- 2,042. Nuestra comparación tiene dos posibles resultados:
- La estadística de la prueba es menos extrema que los valores t críticos, esto es, ni menor que -2,042 ni mayor que +2,042. No puede rechazar la hipótesis nula de que la media es igual al valor especificado. En nuestro ejemplo, no podríamos concluir que hay que cambiar las etiquetas de las barritas de proteínas.
- La estadística de la prueba es más extrema que los valores t críticos, esto es, menor que -2,042 o mayor que +2,042. Rechaza la hipótesis nula de que la media es igual al valor especificado. En nuestro ejemplo, concluiríamos que habría que actualizar las etiquetas o mejorar los procesos de producción para fabricar barritas que tuvieran, de media, 20 gramos de proteínas.
Probar si hay normalidad
La hipótesis de normalidad es más importante para tamaños muestrales pequeños que para muestras grandes.
Las distribuciones normales son simétricas, es decir, "iguales" a ambos lados del centro. Las distribuciones normales no tienen valores extremos ni valores atípicos. Puede comprobar estas dos características de una distribución normal con gráficos. Antes decidimos que los datos de las barritas estaban “suficientemente próximos” a la distribución normal como para seguir adelante con la hipótesis de normalidad. En la siguiente figura se muestra un gráfico de cuantiles normales de los datos, que apoya nuestra decisión.
También puede llevar a cabo una prueba formal de normalidad utilizando software. En la figura siguiente se muestran los resultados de la prueba de normalidad con el software JMP. No podemos rechazar la hipótesis de distribución normal.
Podemos mantener nuestra hipótesis de que los datos de las barritas tienen una distribución normal.
¿Y si mis datos no tienen una distribución normal?
Si los tamaños de sus muestras son muy pequeños, es difícil hacer la prueba de normalidad. En esa situación, puede que deba basarse en su comprensión de las medidas. Por ejemplo, para los datos de las barritas energéticas, el fabricante sabe que la distribución subyacente de gramos de proteínas es una distribución normal. Incluso para una muestra pequeña, el fabricante probablemente seguiría adelante con la prueba t y asumiría normalidad.
¿Y si se sabe que las medidas subyacentes no siguen una distribución normal? ¿O si el tamaño muestral es grande y se rechaza la prueba de normalidad? En esta situación, se puede utilizar un análisis no paramétrico. Los análisis no paramétricos no dependen de una hipótesis de que los valores de datos siguen una distribución específica. En una prueba t de una muestra, una prueba no paramétrica sería la prueba de los rangos con signo de Wilcoxon.
Comprender los valores p
Utilizando una visualización, se puede comprobar si la estadística de la prueba es un valor más extremo que el especificado en la distribución. En la siguiente figura se muestra una distribución t con 30 grados de libertad.
Como nuestra prueba es bilateral y hemos definido α = 0,05, la figura muestra que el valor de 2,042 «corta» el 5 % de los datos en ambas colas juntas.
En la siguiente figura se muestran nuestros resultados. Puede ver que la estadística de la prueba queda por encima de nuestro valor crítico especificado. Está lo bastante «hacia la cola» como para rechazar la hipótesis de que la media es igual a 20.
Combinarlo todo con software
Lo más probable es que use un programa para realizar la prueba t. En la siguiente figura se muestran los resultados de la prueba t para una muestra con los datos de barritas energéticas usando el software JMP.
El software muestra el valor de 20 de nuestra hipótesis nula y la media y desviación estándar de los datos. La estadística de la prueba es 3,07. Esto encaja con nuestros cálculos anteriores.
El software muestra resultados para una prueba bilateral y para las pruebas unilaterales. Nos interesa la prueba bilateral. Nuestra hipótesis nula es que la media de gramos de proteínas es igual a 20. Nuestra hipótesis alternativa es que la media de gramos de proteínas es distinta de 20. El software muestra un valor de p de 0,0046 para la prueba bilateral. El valor p describe la probabilidad de encontrar una media de muestra igual o superior a 21,4 si la media poblacional subyacente es realmente 20; en otras palabras, la probabilidad de observar una media muestral tan diferente, o incluso más diferente de 20, que la media que observamos en nuestra muestra. Un valor p de 0,0046 indica que hay unas 46 posibilidades entre 10 000. Podemos rechazar la hipótesis nula de una media poblacional igual a 20 con confianza.