La distribución t

¿Qué es la distribución t?

La distribución t describe las distancias estandarizadas de las medias de la muestra hasta la media de la población cuando la desviación estándar de la población no se conoce, y las observaciones vienen de una población con una distribución normal.

¿Es la distribución tla misma que la distribución t de Student?

Sí.

¿Cuál es la diferencia fundamental entre las distribuciones  t y z?

La distribución normal estándar o distribución z asume que se conoce la desviación estándar de la población. La distribución tse basa en la desviación estándar de la muestra.

Distribución t comparada con distribución normal

La distribución t es similar a una distribución normal. Tiene una definición matemática exacta. En lugar de meternos en matemáticas complejas, vamos a echar un vistazo a las propiedades útiles de la distribución t y por qué es importante en los análisis.

  • Como en el caso de la distribución normal, la forma de la distribución t es suave.
  • Como la distribución normal, la distribución t es simétrica. Si imagina plegar la distribución por la media, ambos lados serán iguales.
  • Como en una distribución normal estándar (o distribución z), la distribución t tiene una media de cero.
  • La distribución normal supone que la desviación estándar de la población es conocida. La distribución tno hace esta suposición.
  • La distribución tse define por los grados de libertad. Estos grados de libertad están relacionados con el tamaño muestral.
  • La distribución t es más útil para tamaños muestrales pequeños, cuando la desviación estándar de la población no se conoce, o ambos.
  • A medida que aumenta el tamaño muestral, la distribución tse hace más parecida a una distribución normal.

Considere el siguiente gráfico en el que se comparan tres distribuciones t con una distribución normal estándar:

Figura 1: tres distribuciones t y una distribución normal estándar (z).

Todas las distribuciones tienen una forma alisada. Todas ellas son simétricas. Todas ellas tienen una media de cero.

La forma de la distribución t depende de los grados de libertad. Las curvas con más grados de libertad son más altas y tienen colas más delgadas. Las tres distribuciones t tienen "colas más gruesas" que la distribución z.

Se puede ver cómo las curvas con más grados de libertad se parecen más a una distribución z. Compare la curva rosa con un grado de libertad con la curva verde de la distribución z. La distribución tcon un grado de libertad es más corta y tiene colas más gruesas que la distribución z. Compare luego la curva azul con 10 grados de libertad con la curva verde de la distribución z. Estas dos distribuciones son muy similares.

Por regla general, para un tamaño muestral de, al menos, 30, se puede utilizar la distribución z en lugar de una distribución t. En la figura 2 a continuación se muestra una distribución tcon 30 grados de libertad y una distribución z. En la figura se usa una curva verde de línea de puntos para z, para poder ver ambas curvas. Esta similitud es una de las razones por las que se usa una distribución z en métodos estadísticos en lugar de una distribución t, cuando el tamaño muestral es lo bastante grande.

Figura 2: distribución z y distribución t con 30 grados de libertad

Colas para pruebas de hipótesis y la distribución t

Cuando se lleva a cabo una prueba t, se verifica si la estadística de la prueba es un valor más extremo que el esperado de la distribución t.

Para una prueba de dos colas, se examinan ambas colas de la distribución. En la figura 3 a continuación se muestra el proceso de decisión para una prueba de dos colas. La curva es una distribución t con 21 grados de libertad. El valor de la distribución tcon α = 0,05/2 = 0,025 es 2,080. Para una prueba de dos colas, se rechaza la hipótesis nula si la estadística de la prueba es mayor que el valor absoluto del valor de referencia. Si el valor de la estadística de la prueba está en la cola superior o en la inferior, la hipótesis nula se rechaza. Si la estadística de la prueba está dentro de las dos líneas de referencia, se deja de rechazar la hipótesis nula.

Figura 3: Proceso de decisión para una prueba de dos colas

Para una prueba de una cola, se examina únicamente una de las colas de la distribución. Por ejemplo, en la figura 4 a continuación se muestra el proceso de decisión para una prueba de una cola. La curva es de nuevo una distribución t con 21 grados de libertad. Para una prueba de una cola, el valor de la distribución tcon α = 0,05 es de 1,721. Se rechaza la hipótesis nula si la estadística de la prueba es mayor que el valor de referencia. Si la estadística de la prueba está por debajo de la línea de referencia, no se puede rechazar la hipótesis nula.

Figura 4: Proceso de decisión para una prueba de una cola

Cómo utilizar una tabla de t

La mayor parte de personas utilizan software para efectuar los cálculos necesarios para las pruebas t. Pero en muchos libros de estadística aún hay tablas de t, así que puede ser útil saber cómo utilizarlas. En los siguientes pasos se describe cómo utilizar una tabla de t típica.

  1. Identifique si la tabla es para pruebas de dos colas o de una cola. A continuación, decida si su prueba es de una o de dos colas. En las columnas de una tabla de t se identifican distintos niveles de alfa.
    Si su tabla es para pruebas de una cola, aún puede utilizarla para una prueba de dos colas. Si establece α = 0,05 para su prueba de dos colas y solo tiene una tabla de una cola, utilice la columna para α = 0,025.
  2. Identifique los grados de libertad de sus datos. Las filas de una tabla de t corresponden a diferentes grados de libertad. La mayor parte de tablas llegan hasta 30 grados de libertad y se paran. Las tablas asumen que, para tamaños muestrales mayores, las personas utilizarán una distribución z.
  3. Busque en la tabla la celda que se encuentra en la intersección del nivel α y los grados de libertad. Este es el valor de la distribución t. Compare su estadística con el valor de la distribución ty saque la conclusión apropiada.