Prueba de independencia de ji cuadrado

¿Qué es la prueba de independencia ji cuadrado?

La prueba de independencia de ji cuadrado es una prueba estadística de hipótesis que se usa para determinar si dos variables categóricas o nominales pueden estar o no relacionadas.

¿Cuándo puedo usar esta prueba?

Puede usar esta prueba cuando tenga conteos de valores de dos variables categóricas.

¿Puedo usar esta prueba si tengo los conteos de frecuencia en una tabla?

Sí. Si solo tiene una tabla de valores con los conteos de frecuencia, puede usar esta prueba.

Usar la prueba de independencia ji cuadrado

La prueba de independencia ji cuadrado comprueba si es probable que dos variables estén o no relacionadas. Tenemos conteos de dos variables nominales o categóricas. También tenemos la noción de que ambas no están relacionadas. Esta prueba nos da una forma de decidir si esta noción es plausible o no.

Las siguientes secciones repasan lo que necesitamos para la prueba, cómo llevarla a cabo, cómo entender los resultados, detalles estadísticos y cómo interpretar valores p.

¿Qué necesito?

Para la prueba de independencia de ji cuadrado necesitamos dos variables. Nuestra idea es que ambas no guardan relación. He aquí un par de ejemplos:

  • Tenemos una lista de géneros cinematográficos; es nuestra primera variable. La segunda variable es si los espectadores de estos géneros compran snacks en el cine o no. Nuestra idea (o en términos estadísticos, nuestra hipótesis nula) es que el tipo de película y la compra de snacks no guardan relación. El propietario del cine quiere estimar cuántos snacks comprar. Si género y snacks son independientes, la estimación será más sencilla que si el tipo de película afecta a las ventas de aperitivos.
  • Una clínica veterinaria tiene una lista de las razas de perros que atienden. La segunda variable es si sus dueños les dan comida seca, enlatada o una combinación de ambas. Nuestra idea es que la raza de perro y el tipo de dieta son independientes. Si es el caso, la clínica puede hacer pedidos de alimento solo en función del número de perros, sin atender a su raza.

Para realizar una prueba válida necesitamos:

  • Valores de datos que son una muestra aleatoria simple de la población de interés.
  • Dos variables categóricas o nominales. No use la prueba de independencia en variables continuas que definen las combinaciones de categoría. Sin embargo, los conteos de combinaciones de las dos variables categóricas serán continuos.
  • Para cada combinación de niveles de las dos variables, necesitamos por lo menos cinco valores esperados. Cuando tenemos menos de cinco valores para cualquier combinación, los resultados de la prueba no son fiables.

Ejemplo de prueba de independencia de ji cuadrado

Vamos a examinar con más atención el ejemplo de los snacks en el cine. Supongamos que recogemos datos de 600 personas en nuestro cine. Para cada persona, sabemos el tipo de película que vieron y si compraron snacks o no.

Vamos a empezar por responder a esto: ¿Es la prueba de independencia de ji cuadrado un método apropiado para evaluar la relación entre el tipo de película y las compras de snacks?

  • Tenemos una muestra aleatoria simple de 600 personas que han visto una película en nuestro cine. Cumplimos este requisito.
  • Nuestras variables son el tipo de película y si se compraron o no snacks. Ambas variables son categóricas. Cumplimos este requisito.
  • El último requisito es que haya más de cinco valores esperados para cada combinación de las dos variables. Para confirmarlo, tenemos que saber los conteos totales para cada tipo de película y los de si se compraron o no snacks. Por ahora, supondremos que cumplimos este requisito y lo comprobaremos más adelante. 

Parece que, en efecto, hemos seleccionado un método válido. (Aún tenemos que comprobar que se esperen más de cinco valores para cada combinación.)

He aquí nuestros datos resumidos en una tabla de contingencia:

Tabla 1: Tabla de contingencia para datos de películas y snacks

Tipo de películaSnacksNo snacks
Acción5075
Comedia125175
Familiar9030
Terror4510

Antes de ir más allá, vamos a comprobar la suposición de cinco valores esperados en cada categoría. Los datos tienen más de cinco conteos en cada combinación de tipo de película y snacks. Pero ¿cuáles son los conteos esperados si el tipo de película y las compras de snacks son independientes?

Hallar conteos esperados

Para hallar los conteos esperados para cada combinación película-snacks primero necesitamos los totales de fila y de columna, que se muestran a continuación.

Tabla 2: Tabla de contingencia para datos de películas y snacks con totales de fila y de columna

Tipo de películaSnacksNo snacksTotales de fila
Acción5075125
Comedia125175300
Familiar9030120
Terror451055
Totales de columna310290SUMA TOTAL = 600

Los conteos esperados para cada combinación de película-snack se basan en los totales de fila y columna. Multiplicamos el total de fila por el de columna y luego dividimos por la suma total. Esto nos da el conteo esperado para cada celda de la tabla. Por ejemplo, para la celda Acción-Snacks, tenemos:

$ \frac{125\times310}{600} = \frac{38,750}{600} = 65 $

Hemos redondeado la respuesta al número entero más próximo. Si no hay relación entre el tipo de película y la compra de snacks, esperaríamos que 65 personas hubiesen visto una película de acción con snacks.

He aquí los conteos reales y esperados para cada combinación de película-snack. En cada celda de la Tabla 3, que se muestra a continuación, el conteo esperado aparece en negrita debajo del conteo real. Los conteos esperados están redondeados al número entero más próximo.

Tabla 3: Tabla de contingencia para los datos de películas y snacks, que muestran el conteo real comparado con el esperado

Tipo de películaSnacksNo snacksTotales de fila
Acción50
65
75
60
125
Comedia125
155
175
145
300
Familiar90
62
30
58
120
Terror45
28
10
27
55
Totales de columna310290SUMA TOTAL = 600

Al utilizar software, estos valores calculados se etiquetarán como “valores esperados” “conteos de celdas esperados" o algún término similar.

Todos los conteos esperados para nuestros datos son mayores que cinco, de manera que cumplimos el requisito para aplicar la prueba de independencia.

Antes de calcular la estadística de la prueba, vamos a echar un vistazo de nuevo a la tabla de contingencia. Los conteos esperados utilizan los totales de fila y de columna. Si miramos cada una de las celdas, veremos que algunos de los conteos esperados son próximos a los reales, pero la mayoría no. Si no hay relación alguna entre el tipo de película y las compras de snacks, los conteos real y esperado serán similares. Si hay relación, los conteos real y esperado serán diferentes.

Un error habitual con los conteos esperados es limitarse a dividir la suma total por el número de celdas. En el caso de nuestros datos de películas, es 600 / 8 = 75. Esto no es correcto. Sabemos los totales de fila y de columna. Estos son fijos y no pueden cambiar para nuestros datos. Los valores esperados se basan en los totales de fila y columna, no solo en la suma total.

Hacer la prueba

La idea básica al calcular la estadística de la prueba es comparar los resultados esperados y los reales, en función de los totales de fila y columna que tenemos en los datos. Primero calculamos la diferencia entre conteos reales y esperados para cada combinación de película-snacks. Luego calculamos su cuadrado. Elevarlos al cuadrado le da la misma importancia a las combinaciones con más y con menos valores reales que los esperados. A continuación, dividimos por el valor esperado de la combinación. Sumamos estos valores para cada combinación película-snacks. Esto nos da la estadística de la prueba.

Esto es mucho más fácil de seguir si usamos los datos de nuestro ejemplo. La tabla 4 a continuación muestra los cálculos para cada combinación película-snacks hasta el segundo decimal.  

Tabla 4: Preparación para calcular la estadística de la prueba

Tipo de películaSnacksNo snacks
AcciónReal: 50
Esperado: 64,58
Real: 75
Esperado: 60,42

Diferencia: 50 – 64,58 = -14,58

Diferencia al cuadrado: 212,67

Dividir por esperado: 212,67/64,58 = 3,29

Diferencia: 75 – 60,42 = 14,58

Diferencia al cuadrado: 212,67

Dividir por esperado: 212,67/60,42 = 3,52

ComediaReal: 125
Esperado: 155
Real: 175
Esperado: 145

Diferencia: 125 – 155 = -30

Diferencia al cuadrado: 900

Dividir por esperado: 900/155 = 5,81

Diferencia: 175 – 145 = 30

Diferencia al cuadrado: 900

Dividir por esperado: 900/145 = 6,21

FamiliarReal: 90
Esperado: 62
Real: 30
Esperado: 58

Diferencia: 90 – 62 = 28

Diferencia al cuadrado: 784

Dividir por esperado: 784/62 = 12,65

Diferencia: 30 – 58 = -28

Diferencia al cuadrado: 784

Dividir por esperado: 784/58 = 13,52

TerrorReal: 45
Esperado: 28,42
Real: 10
Esperado: 26,58

Diferencia: 45 – 28,42 = 16,58

Diferencia al cuadrado: 275,01

Dividir por esperado: 275,01/28,42 = 9,68

Diferencia: 10 – 26,58 = -16,58

Diferencia al cuadrado: 275,01

Dividir por esperado: 275,01/26,58 = 10,35

Por último, para obtener la estadística de la prueba, sumamos los números de la última fila para cada celda:

3,29 + 3,52 + 5,81 + 6,21 + 12,65 + 13,52 + 9,68 + 10,35 = 65,03

Para tomar nuestra decisión, comparamos la estadística de la prueba con un valor de la distribución ji cuadrado. Esta actividad tiene cinco fases:

  1. En primer lugar, decidimos qué riesgo estamos dispuestos a asumir de extraer la conclusión de que las dos variables no son independientes. Para los datos de las películas, hemos decidido antes de nuestra recopilación de datos que estamos dispuestos a asumir un riesgo del 5 % de decir que las dos variables –Tipo de película y Compra de snacks– no son independientes cuando en realidad sí lo son. En lenguaje de estadísticas, establecemos el nivel de significación, α , en 0,05.
  2. Calculamos una estadística de prueba. Como se muestra arriba, nuestra estadística de prueba es 65,03.
  3. Hallamos el valor crítico de la distribución ji cuadrado según nuestros grados de libertad y nuestro nivel de significación. Este es el valor esperado si las dos variables son independientes.
  4. Los grados de libertad dependen del número de filas y de columnas que tengamos. Los grados de libertad (gl) se calculan como:
    $ \text{df} = (r-1)\times(c-1) $

    En la fórmula, r es el número de filas, y c es el número de columnas de nuestra tabla de contingencia. A partir de nuestro ejemplo, con Tipo de película en la filas y Compra de snacks en las columnas, tenemos:
    $ \text{df} = (4-1)\times(2-1) = 3\times1 = 3 $

    El valor de ji cuadrado con α = 0,05 y tres grados de libertad es 7,815.
  5. Comparamos el valor de nuestra estadística de prueba (65,03) con el valor de ji cuadrado. Como 65,03 > 7,815, rechazamos la idea de que el tipo de película y las compras de snacks son independientes.

 

Llegamos a la conclusión de que hay alguna relación entre el tipo de película y las compras de snacks. El propietario del cine no puede hacer una estimación de la cantidad de snacks que debe comprar independientemente del tipo de películas que se proyecten. En vez de eso, el propietario debe pensar en el tipo de películas que se proyectan al estimar las compras de snacks.

Es importante señalar que no podemos llegar a la conclusión de que el tipo de película causa una compra de snacks. La prueba de independencia solo nos indica si hay o no una relación; no nos dice que una variable sea la causa de la otra.

Comprender los resultados

Vamos a utilizar gráficos para comprender la prueba y los resultados.

El diagrama comparativo a continuación muestra el número real observado de unidades en azul y el esperado en naranja. El conteo aparece encima de las barras. El cuadro amarillo muestra el tipo de película y el total de consumiciones de snacks. Necesitamos estos totales para hallar los conteos esperados. 

Figura 1: Diagrama de barras que muestra los conteos esperados y reales para los distintos tipos de película

Compare los conteos real y esperado para las películas de Terror. Verá que más personas de las esperadas han comprado snacks, y que menos de las esperadas optaron por no comprarlos.

Si examina los cuatro tipos de películas y el hecho de si las personas compraron snacks, verá que hay una diferencia bastante grande entre los conteos reales y los esperados para la mayor parte de combinaciones. La prueba de independencia comprueba si los datos reales son “lo bastante próximos” a los conteos esperados que ocurrirían si las dos variables son independientes. Aún sin una prueba estadística, la mayor parte de personas dirían que las dos variables no son independientes. La prueba estadística ofrece un método común para tomar la decisión, de manera que todas las personas tomen la misma decisión según los datos específicos.

En el gráfico siguiente se muestra otro posible conjunto de datos. Este conjunto tiene exactamente los mismos totales de fila y columna para el tipo de película y la compra de snacks, pero las divisiones de sí/no en los datos de compra de snacks son distintas. 

Figura 2: Diagrama de barras que muestra los conteos reales y los esperados utilizando distintas muestras de datos

Las barras violetas muestran los conteos reales en estos datos. Las barras naranjas muestran los conteos esperados, que son los mismos que en nuestro conjunto de datos originales. Los conteos esperados son los mismos porque los totales de fila y los de columna son los mismos. Al mirar el gráfico de arriba, la mayor parte de personas pensarían que el tipo de película y las compras de snacks son independientes. Si lleva a cabo la prueba de ji cuadrado de independencia utilizando estos nuevos datos, la estadística de la prueba es 0,903. El valor de ji cuadrado es aún 7,815 porque los grados de libertad siguen siendo tres. Así, no rechazaría la idea de independencia porque 0,903 < 7,815. El propietario del cine puede hacer una estimación de la cantidad de snacks que debe comprar independientemente del tipo de películas que se proyecten. 

Detalles estadísticos

Echemos un vistazo a los datos de compra de aperitivos y la prueba de ji cuadrado de independencia en términos estadísticos.

Nuestra hipótesis nula es que el tipo de película y la compra de snacks son independientes. La hipótesis nula se escribe así:

$ H_0: \text{El tipo de película y la compra de snacks son independientes} $

La hipótesis alternativa es la contraria.

$ H_a: \text{El tipo de película y la compra de snacks no son independientes} $

Antes de calcular la estadística de la prueba, hallamos los conteos esperados. Esto se expresa así:

$ Σ_{ij} = \frac{R_i\times{C_j}}{N} $

La fórmula es para una tabla de contingencia de i x j. Es una tabla con i columnas y j filas. Por ejemplo, E11 es el conteo esperado para la celda de la primera fila y primera columna. La fórmula muestra Ri como el total de la fila i y Cj como total de la columna j. El tamaño muestral total es N.  

Calculamos la mejor prueba estadística utilizando la fórmula siguiente:

$ Σ^n_{i,j=1} = \frac{(O_{ij}-E_{ij})^2}{E_{ij}} $

En la fórmula anterior, tenemos n combinaciones de filas y columnas. El símbolo Σ representa el sumatorio de los cálculos de cada combinación. (Hemos dado estos mismos pasos en el ejemplo sobre snacks en el cine que empieza en la tabla 4) La fórmula muestra Oij como conteo observado de la combinación ij y Eij  como conteo esperado para dicha combinación. Para el ejemplo de snacks en el cine, tenemos cuatro filas y dos columnas, lo que da ocho combinaciones.

A continuación comparamos la estadística de la prueba con el valor crítico ji cuadrado que corresponde al valor alfa que hemos definido y a los grados de libertad de nuestros datos. Con los datos sobre los snacks en el cine como ejemplo, hemos definido α =0,05 y tres grados de libertad. Para los datos de los snacks, el valor de ji cuadrado se escribe como:

$ χ_{0.05,3}^2 $

Nuestra comparación tiene dos posibles resultados:

  • La estadística de la prueba es menor que el valor de ji cuadrado. No puede rechazar la hipótesis de independencia. En este ejemplo sobre snacks en el cine, el propietario del cine puede seguir asumiendo que el tipo de película que va a ver alguien no guarda relación con si compra o no snacks.
  • La estadística de la prueba es mayor que el valor de ji cuadrado. Rechaza la hipótesis de independencia. En este ejemplo sobre snacks en el cine, el propietario del cine no puede seguir asumiendo que el tipo de película que va a ver alguien no guarda relación con si compra o no snacks.

Comprender los valores p

Vamos a utilizar un gráfico de la distribución ji cuadrado para entender mejor los valores p. Está comprobando si la estadística de la prueba es un valor más extremo de la distribución que el valor crítico. A continuación se muestra el gráfico de una distribución ji cuadrado con tres grados de libertad. Muestra cómo un valor de 7,815 "excluye" un 95 % de los datos. Solo el 5 % de los datos de una distribución ji cuadrado con tres grados de libertad es mayor que 7,815.

 

Figura 3: Gráfico de distribución ji cuadrado para tres grados de libertad

En el siguiente gráfico de distribución se muestran nuestros resultados. Puede verse lo lejos "en la cola" que queda la estadística de prueba. De hecho, con esta escala, parece como si la curva de la distribución estuviera en cero en el punto en que intersecta con nuestra estadística de prueba. No lo está, pero está realmente próxima a cero. Podemos llegar a la conclusión de que es muy poco probable que esta situación suceda por azar. Los resultados recopilados de los espectadores serían extremadamente improbables si realmente no hubiese relación entre los tipos de película y las compras de snacks.

Figura 4: Gráfico de distribución ji cuadrado para tres grados de libertad con la estadística de la prueba representada

El software estadístico muestra el valor p de una prueba. Es la probabilidad de que una muestra del mismo tamaño dé como resultado un valor de estadística de la prueba más extremo que la estadística de la prueba de nuestra muestra actual, suponiendo que la hipótesis nula es correcta. Es difícil calcular esto a mano. Para la figura anterior, si la estadística de la prueba es exactamente 7,815, el valor p será p=0,05. Con una estadística de la prueba de 65,03, el valor p es muy, muy pequeño. En este ejemplo, la mayor parte del software estadístico indicará el valor p como “p < 0,0001”. Esto significa que la probabilidad de que otra muestra aleatoria (suponiendo que la hipótesis nula sea cierta) tenga como resultado un valor más extremo para la estadística de la prueba es menor que uno entre 10 000.