Analizar sus datos > Analizar las relaciones > Utilizar la regresión con múltiples predictores
Fecha de publicación: 08/20/2023

Utilizar la regresión con múltiples predictores

En Utilizar la regresión con un predictor se mostraba cómo se crean modelos simples de regresión con un predictor y una variable de respuesta. La regresión múltiple predice la variable respuesta media utilizando dos o más predictores.

Escenario

Este ejemplo utiliza la tabla de datos Candy Bars.jmp, que contiene información nutricional de barras de caramelo.

Un dietista desea realizar una predicción de las calorías a partir de la información siguiente:

Grasa total

Carbohidratos

Proteínas

Utilice la regresión múltiple para realizar una predicción de la variable respuesta media utilizando estos tres predictores.

Descubrir la relación

Para visualizar la relación entre calorías y grasa total, carbohidratos y proteínas, creamos una matriz de gráficos de dispersión:

1. Seleccione Ayuda > Carpeta de muestras de datos y abra Candy Bars.jmp.

2. Seleccione Gráficos > Matriz de gráficos de dispersión.

3. Seleccione Calories y haga clic en Y, Columnas.

4. Seleccione Total fat g, Carbohydrate g y Protein g y haga clic en X.

5. Haga clic en Aceptar.

Figura 5.26 Resultados de la matriz de gráficos de dispersión 

Scatterplot Matrix Results

La matriz de gráficos de dispersión muestra que existe una correlación positiva entre las calorías y las tres variables. La correlación entre calorías y la grasa total es la más fuerte. Ahora que el dietista sabe que existe una relación, puede construir un modelo de regresión múltiple para predecir las calorías medias.

Construir el modelo de regresión múltiple

Siga utilizando la tabla de la muestra de datos Candy Bars.jmp.

1. Seleccione Análisis > Ajuste del modelo.

2. Seleccione Calories y haga clic en Y.

3. Seleccione Total fat g, Carbohydrate g y Protein g y haga clic en Agregar.

4. Junto a Énfasis, seleccione Cribado de los efectos.

Figura 5.27 Ventana Ajuste del modelo 

Fit Model Window

5. Haga clic en Ejecutar.

La ventana de resultados muestra los resultados del modelo. Para interpretar los resultados del modelo, centrémonos en estas áreas:

Consultar el gráfico Observados frente a predichos

Interpretar la estimación de los parámetros

Utilizar el Perfilador de predicción

Nota: Para conocer más detalles acerca de todos los resultados del modelo, consulte Fitting Linear Models.

Consultar el gráfico Observados frente a predichos

El gráfico Observados frente a predichos muestra las calorías reales frente a las predichas. Puesto que los valores predichos se acercan a los valores reales, los puntos del gráfico de dispersión quedan cerca de la línea roja (Figura 5.28). Como se puede observar, los puntos están muy cerca de la línea, así que el modelo predice bien las calorías a partir de los factores elegidos.

Figura 5.28 Gráfico Observados frente a predichos 

Actual by Predicted Plot

Otra medida de precisión del modelo es el valor R cuadrado, que aparece debajo del gráfico en la Figura 5.28. El valor RSq mide el porcentaje de la variabilidad de las calorías explicada por el modelo. Un valor cerca de 1 significa que el modelo predice bien. En este ejemplo, el valor RSq es 0,99.

Interpretar la estimación de los parámetros

El informe Estimación de los parámetros contiene la información siguiente:

los coeficientes del modelo

los valores p de cada parámetro

Figura 5.29 Informe Estimación de los parámetros 

Parameter Estimates Report

En este ejemplo, los valores p son muy pequeños (<0,0001). Esto indica que los tres efectos (grasa, carbohidratos y proteínas) contribuyen de forma significativa a la predicción de calorías.

Los coeficientes del modelo se pueden usar para predecir el valor de las calorías con valores determinados de grasa, carbohidratos y proteínas. Por ejemplo, supongamos que queremos predecir las calorías medias de cualquier barra de caramelo que tenga estas características:

Grasa = 11 g

Carbohidratos = 43 g

Proteínas = 2 g

Con estos valores se puede calcular una predicción de las calorías medias así:

277,92 = -5,9643 + 8,99*11 + 4,0975*43 + 4,4013*2

Las características de este ejemplo son las mismas que las de la barra de caramelo Milky Way (en la fila 59 de la tabla de datos). El valor real de calorías de Milky Way es 280, lo cual indica que el modelo predice bien.

Utilizar el Perfilador de predicción

Mediante el Perfilador de predicción se puede estudiar cómo los cambios en los factores afectan a los valores predichos. Las líneas de perfil muestran la magnitud del cambio en las calorías a medida que cambia el factor. La línea de Total fat g es la más inclinada, lo cual significa que las variaciones en la grasa total tienen el efecto mayor sobre las calorías.

Figura 5.30 Perfilador de predicción 

Prediction Profiler

Haga clic y arrastre la línea vertical correspondiente a cada factor para ver cómo cambia el valor predicho. También puede hacer clic en los valores actuales de los factores y cambiarlos. Por ejemplo, haga clic en los valores del factor y escriba los valores de la barra de caramelo Milky Way (fila 59).

Figura 5.31 Valores de los factores para Milky Way 

Factor Values for the Milky Way

Nota: Para obtener más información acerca del Perfilador de predicción, consulte Profilers.

Extraer conclusiones

Ahora el dietista dispone de un buen modelo para predecir las calorías de una golosina a partir de la grasa total, los carbohidratos y las proteínas.

¿Quieres más información? ¿Tiene preguntas? Obtenga respuestas en la comunidad de usuarios de JMP (community.jmp.com).