En Utilizar la regresión con un predictor se mostraba cómo se crean modelos simples de regresión con un predictor y una variable de respuesta. La regresión múltiple predice la variable respuesta media utilizando dos o más predictores.
Este ejemplo utiliza la tabla de datos Candy Bars.jmp, que contiene información nutricional de barras de caramelo.
Un dietista desea realizar una predicción de las calorías a partir de la información siguiente:
• Grasa total
• Carbohidratos
• Proteínas
Utilice la regresión múltiple para realizar una predicción de la variable respuesta media utilizando estos tres predictores.
Para visualizar la relación entre calorías y grasa total, carbohidratos y proteínas, creamos una matriz de gráficos de dispersión:
1. Seleccione Ayuda > Carpeta de muestras de datos y abra Candy Bars.jmp.
2. Seleccione Gráficos > Matriz de gráficos de dispersión.
3. Seleccione Calories y haga clic en Y, Columnas.
4. Seleccione Total fat g, Carbohydrate g y Protein g y haga clic en X.
5. Haga clic en Aceptar.
Figura 5.26 Resultados de la matriz de gráficos de dispersión
La matriz de gráficos de dispersión muestra que existe una correlación positiva entre las calorías y las tres variables. La correlación entre calorías y la grasa total es la más fuerte. Ahora que el dietista sabe que existe una relación, puede construir un modelo de regresión múltiple para predecir las calorías medias.
Siga utilizando la tabla de la muestra de datos Candy Bars.jmp.
1. Seleccione Análisis > Ajuste del modelo.
2. Seleccione Calories y haga clic en Y.
3. Seleccione Total fat g, Carbohydrate g y Protein g y haga clic en Agregar.
4. Junto a Énfasis, seleccione Cribado de los efectos.
Figura 5.27 Ventana Ajuste del modelo
5. Haga clic en Ejecutar.
La ventana de resultados muestra los resultados del modelo. Para interpretar los resultados del modelo, centrémonos en estas áreas:
• Consultar el gráfico Observados frente a predichos
• Interpretar la estimación de los parámetros
• Utilizar el Perfilador de predicción
Nota: Para conocer más detalles acerca de todos los resultados del modelo, consulte Fitting Linear Models.
El gráfico Observados frente a predichos muestra las calorías reales frente a las predichas. Puesto que los valores predichos se acercan a los valores reales, los puntos del gráfico de dispersión quedan cerca de la línea roja (Figura 5.28). Como se puede observar, los puntos están muy cerca de la línea, así que el modelo predice bien las calorías a partir de los factores elegidos.
Figura 5.28 Gráfico Observados frente a predichos
Otra medida de precisión del modelo es el valor R cuadrado, que aparece debajo del gráfico en la Figura 5.28. El valor RSq mide el porcentaje de la variabilidad de las calorías explicada por el modelo. Un valor cerca de 1 significa que el modelo predice bien. En este ejemplo, el valor RSq es 0,99.
El informe Estimación de los parámetros contiene la información siguiente:
• los coeficientes del modelo
• los valores p de cada parámetro
Figura 5.29 Informe Estimación de los parámetros
En este ejemplo, los valores p son muy pequeños (<0,0001). Esto indica que los tres efectos (grasa, carbohidratos y proteínas) contribuyen de forma significativa a la predicción de calorías.
Los coeficientes del modelo se pueden usar para predecir el valor de las calorías con valores determinados de grasa, carbohidratos y proteínas. Por ejemplo, supongamos que queremos predecir las calorías medias de cualquier barra de caramelo que tenga estas características:
• Grasa = 11 g
• Carbohidratos = 43 g
• Proteínas = 2 g
Con estos valores se puede calcular una predicción de las calorías medias así:
277,92 = -5,9643 + 8,99*11 + 4,0975*43 + 4,4013*2
Las características de este ejemplo son las mismas que las de la barra de caramelo Milky Way (en la fila 59 de la tabla de datos). El valor real de calorías de Milky Way es 280, lo cual indica que el modelo predice bien.
Mediante el Perfilador de predicción se puede estudiar cómo los cambios en los factores afectan a los valores predichos. Las líneas de perfil muestran la magnitud del cambio en las calorías a medida que cambia el factor. La línea de Total fat g es la más inclinada, lo cual significa que las variaciones en la grasa total tienen el efecto mayor sobre las calorías.
Figura 5.30 Perfilador de predicción
Haga clic y arrastre la línea vertical correspondiente a cada factor para ver cómo cambia el valor predicho. También puede hacer clic en los valores actuales de los factores y cambiarlos. Por ejemplo, haga clic en los valores del factor y escriba los valores de la barra de caramelo Milky Way (fila 59).
Figura 5.31 Valores de los factores para Milky Way
Nota: Para obtener más información acerca del Perfilador de predicción, consulte Profilers.
Ahora el dietista dispone de un buen modelo para predecir las calorías de una golosina a partir de la grasa total, los carbohidratos y las proteínas.