Utilizzo della regressione con un predittore ha mostrato come creare semplici modelli di regressione costituiti da una variabile predittore e da una variabile di risposta. La regressione multipla prevede la variabile di risposta media utilizzando due o più variabili predittore.
Questo esempio utilizza la tabella di dati Candy Bars.jmp, che contiene informazioni nutrizionali sulle merendine.
Un dietologo desidera prevedere le calorie utilizzando le seguenti informazioni:
• Grasso totale
• Carboidrati
• Proteine
Utilizzare la regressione multipla per prevedere la variabile di risposta media usando queste tre variabili predittore.
Per visualizzare la relazione fra le calorie e il grasso totale, i carboidrati e le proteine, creare una matrice grafico a dispersione:
1. Selezionare Guida > Cartella dati di esempio e aprire Candy Bars.jmp.
2. Selezionare Grafico > Matrice grafico a dispersione.
3. Selezionare Calories e fare clic su Y, Colonne.
4. Selezionare Total fat g, Carbohydrate g e Protein g e fare clic su X.
5. Fare clic su OK.
Figura 5.26 Risultati della matrice del grafico a dispersione
La matrice del grafico a dispersione mostra che esiste una correlazione positiva fra le calorie e tutte e tre le variabili. La correlazione fra le calorie e la quantità totale di grassi è quella più forte. Ora che il dietologo sa che esiste una relazione, può creare un modello di regressione multipla per prevedere le calorie medie.
Continuare a utilizzare la tabella di dati di esempio Candy Bars.jmp.
1. Selezionare Analizza > Stima modello.
2. Selezionare Calories e fare clic su Y.
3. Selezionare Total Fat g, Carbohydrate g Protein g e fare clic su Aggiungi.
4. Accanto a Enfasi, selezionare Screening degli effetti.
Figura 5.27 Finestra Stima modello
5. Fare clic su Esegui.
La finestra dei report mostra i risultati del modello. Per interpretare tali risultati, concentrarsi sulle seguenti aree:
• Visualizzazione del grafico delle risposte osservate rispetto a risposte attese
• Interpretazione delle stime dei parametri
• Utilizzo del Profiler di previsione
Nota: Per ulteriori informazioni su tutti i risultati del modello, consultare Fitting Linear Models.
Il Grafico delle risposte osservate rispetto a risposte attese mostra le calorie osservate rispetto alle calorie previste. Quanto più i valori previsti si avvicinano ai valori osservati, tanto più i punti sul grafico a dispersione si avvicinano alla linea rossa (Figura 5.28). Poiché i punti sono tutti molto vicini alla linea, è possibile vedere che il modello prevede le calorie in base ai fattori scelti.
Figura 5.28 Grafico delle risposte osservate rispetto alle risposte attese
Un'altra misura della precisione del modello è il valore R-quadro (che appare sotto il grafico in Figura 5.28). Il valore R-quadro misura la percentuale di variabilità in calorie, come spiegato dal modello. Quanto più il valore si avvicina a 1 tanto più un modello fa previsioni corrette. In questo esempio, il valore R-quadro è 0.99.
Il report Stime dei parametri mostra le seguenti informazioni:
• I coefficienti del modello
• I p-value per ogni parametro
Figura 5.29 Report Stime dei parametri
In questo esempio, i p-value sono tutti molto piccoli (<.0001). Ciò indica che tutti e tre gli effetti (grassi, carboidrati e proteine) contribuiscono significativamente alla previsione delle calorie.
È possibile utilizzare i coefficienti del modello per prevedere il valore delle calorie per specifici valori di grassi, carboidrati e proteine. Per esempio, supponiamo di voler prevedere le calorie medie per qualsiasi merendina che abbia le seguenti caratteristiche:
• Fat = 11 g
• Carbohydrate = 43 g
• Protein = 2 g
Utilizzando questi valori, è possibile calcolare le calorie medie previste nel modo seguente:
277.92 = -5.9643 + 8.99*11 + 4.0975*43 + 4.4013*2
Le caratteristiche in questo esempio sono uguali a quelle della merendina Milky Way (a riga 59 della tabella di dati). Le calorie effettive di Milky Way sono 280, a dimostrazione che il modello esegue una previsione corretta.
Utilizzare il Profiler di previsione per osservare quali cambiamenti nei fattori influiscono sui valori previsti. Le linee del profilo mostrano la grandezza di cambiamento nelle calorie al variare dei fattori. La linea di Total fat g è la più verticale, per indicare che i cambiamenti nel grasso totale hanno gli effetti più ampi sulle calorie.
Figura 5.30 Profiler di previsione
Selezionare e trascinare la linea verticale per ciascun fattore per osservare come cambia il valore previsto. È anche possibile selezionare i valori dei fattori correnti e cambiarli. Per esempio, fare clic sui valori dei fattori e specificare i valori per la merendina Milky Way (riga 59).
Figura 5.31 Valori dei fattori di Milky Way
Nota: Per ulteriori informazioni sul Profiler di previsione, consultare Profilers.
Il dietologo ha ora un ottimo modello per prevedere le calorie di una merendina in base alla quantità totale di grassi, carboidrati e proteine.