Analizar sus datos > Analizar las relaciones > Comparar medias para una variable
Fecha de publicación: 08/20/2023

Comparar medias para una variable

Si disponemos de una variable Y continua y una variable X categórica, podemos comparar las medias entre los distintos niveles de la variable X.

Escenario

Este ejemplo utiliza la tabla de datos Companies.jmp, que contiene datos financieros de 32 empresas de los sectores farmacéutico e informático.

Un analista financiero desea estudiar lo siguiente:

¿Cómo es la rentabilidad de las empresas de informática en comparación con la de las empresas farmacéuticas?

Para responder a esta pregunta, ajuste los beneficios (Profits ($M)) por tipo (Type).

Descubrir la relación

1. Seleccione Ayuda > Carpeta de muestras de datos y abra Companies.jmp.

2. Si todavía tiene la tabla de la muestra de datos Companies.jmp abierta, es posible que tenga filas excluidas u ocultas. Para devolver las filas al estado predeterminado (todas las filas incluidas y ninguna oculta), seleccione Filas > Borrar estados de fila.

3. Seleccione Análisis > Ajustar Y en función de X.

4. Seleccione Profits ($M) y haga clic en Y, Respuesta.

5. Seleccione Type y haga clic en X, Factor.

6. Haga clic en Aceptar.

Figura 5.15 Beneficios por tipo de empresa 

Profits by Company Type

Hay un valor atípico en el tipo Computer (informática). El valor atípico estira la escala del gráfico y dificulta la comparación de los beneficios. Excluya y oculte el valor atípico:

1. Haga clic en el valor atípico.

2. Seleccione Filas > Excluir/Anular la exclusión. El punto de datos deja de incluirse en los cálculos.

3. Seleccione Filas > Ocultar/Mostrar. El punto de datos se oculta en todos los gráficos.

4. Para volver a crear el gráfico sin el valor atípico, haga clic en Análisis univariante de Profits ($M) por Type y seleccione Rehacer > Rehacer análisis. La ventana del gráfico de dispersión original se puede cerrar.

Figura 5.16 Gráfico actualizado 

Updated Plot

Al quitar el valor atípico el analista financiero obtiene una vista más clara de los datos.

5. Para continuar analizando la relación, seleccione estas opciones en el triángulo rojo situado junto a Análisis univariante de Profits ($M) por Type:

Opciones de visualización > Líneas de la media. Esta opción agrega las líneas de la media al gráfico de dispersión.

Medias y desviaciones estándar. Esta opción muestra un informe que contiene las medias y las desviaciones estándar.

Figura 5.17 Líneas de la media e informe 

Mean Lines and Report

Interpretar los resultados

El analista financiero deseaba saber cómo eran los beneficios de las empresas de informática frente a los de las empresas farmacéuticas. El gráfico de dispersión actualizado muestra que las empresas farmacéuticas tienen beneficios medios superiores que las empresas de informática. En el informe, si restamos el valor medio de unas y otras, la diferencia de beneficios es de unos 635 millones de USD. El gráfico también indica que algunas empresas de informática tienen pérdidas mientras que todas las empresas farmacéuticas tienen beneficios.

Realizar la prueba t

El analista financiero ha mirado solo una muestra de empresas (las que figuran en la tabla de datos). Ahora, el analista financiero desea examinar estas cuestiones:

¿Existe una diferencia real en la población general, o la diferencia de 635 millones de USD se debe al azar?

Si la diferencia existe, ¿cuál es?

Para resolver estas preguntas, realicemos una prueba t para dos muestras. Una prueba t permite usar datos de una muestra para inferir acerca de la población mayor.

Para realizar la prueba t, haga clic en el triángulo rojo junto a Análisis univariante y seleccione Medias/ANOVA/t combinada.

Figura 5.18 Resultados de la prueba t 

t Test Results

El valor p de 0,0001 es menor que el nivel de significación de 0,05, lo cual indica que hay significación estadística. Por consiguiente, el analista financiero puede concluir que la diferencia observada de beneficios medios de la muestra de datos es estadísticamente significativa. Esto significa que en la población mayor, los beneficios medios de las empresas farmacéuticas son distintos de los beneficios medios de las empresas de informática.

Extraer conclusiones

Utilice los límites del intervalo de confianza para determinar cuál es la diferencia entre los beneficios de ambos tipos de empresas. Veamos los valores de Diferencia del límite de control superior y Diferencia del límite de control inferior en la Figura 5.18. El analista financiero concluye que el beneficio medio de las empresas farmacéuticas es entre 343 millones de USD y 926 millones de USD mayor que el beneficio medio de las empresas de informática.

¿Quieres más información? ¿Tiene preguntas? Obtenga respuestas en la comunidad de usuarios de JMP (community.jmp.com).