Analisi dei dati > Analisi delle relazioni > Utilizzo della regressione con più predittori
Data di pubblicazione: 04/15/2024

Utilizzo della regressione con più predittori

Utilizzo della regressione con un predittore ha mostrato come creare semplici modelli di regressione costituiti da una variabile predittore e da una variabile di risposta. La regressione multipla prevede la variabile di risposta media utilizzando due o più variabili predittore.

Scenario

Questo esempio utilizza la tabella di dati Candy Bars.jmp, che contiene informazioni nutrizionali sulle merendine.

Un dietologo desidera prevedere le calorie utilizzando le seguenti informazioni:

Grasso totale

Carboidrati

Proteine

Utilizzare la regressione multipla per prevedere la variabile di risposta media usando queste tre variabili predittore.

Individuazione della relazione

Per visualizzare la relazione fra le calorie e il grasso totale, i carboidrati e le proteine, creare una matrice grafico a dispersione:

1. Selezionare Guida > Cartella dati di esempio e aprire Candy Bars.jmp.

2. Selezionare Grafico > Matrice grafico a dispersione.

3. Selezionare Calories e fare clic su Y, Colonne.

4. Selezionare Total fat g, Carbohydrate g e Protein g e fare clic su X.

5. Fare clic su OK.

Figura 5.26 Risultati della matrice del grafico a dispersione 

Scatterplot Matrix Results

La matrice del grafico a dispersione mostra che esiste una correlazione positiva fra le calorie e tutte e tre le variabili. La correlazione fra le calorie e la quantità totale di grassi è quella più forte. Ora che il dietologo sa che esiste una relazione, può creare un modello di regressione multipla per prevedere le calorie medie.

Creazione del modello di regressione multipla

Continuare a utilizzare la tabella di dati di esempio Candy Bars.jmp.

1. Selezionare Analizza > Stima modello.

2. Selezionare Calories e fare clic su Y.

3. Selezionare Total Fat g, Carbohydrate g Protein g e fare clic su Aggiungi.

4. Accanto a Enfasi, selezionare Screening degli effetti.

Figura 5.27 Finestra Stima modello 

Fit Model Window

5. Fare clic su Esegui.

La finestra dei report mostra i risultati del modello. Per interpretare tali risultati, concentrarsi sulle seguenti aree:

Visualizzazione del grafico delle risposte osservate rispetto a risposte attese

Interpretazione delle stime dei parametri

Utilizzo del Profiler di previsione

Nota: Per ulteriori informazioni su tutti i risultati del modello, consultare Fitting Linear Models.

Visualizzazione del grafico delle risposte osservate rispetto a risposte attese

Il Grafico delle risposte osservate rispetto a risposte attese mostra le calorie osservate rispetto alle calorie previste. Quanto più i valori previsti si avvicinano ai valori osservati, tanto più i punti sul grafico a dispersione si avvicinano alla linea rossa (Figura 5.28). Poiché i punti sono tutti molto vicini alla linea, è possibile vedere che il modello prevede le calorie in base ai fattori scelti.

Figura 5.28 Grafico delle risposte osservate rispetto alle risposte attese 

Actual by Predicted Plot

Un'altra misura della precisione del modello è il valore R-quadro (che appare sotto il grafico in Figura 5.28). Il valore R-quadro misura la percentuale di variabilità in calorie, come spiegato dal modello. Quanto più il valore si avvicina a 1 tanto più un modello fa previsioni corrette. In questo esempio, il valore R-quadro è 0.99.

Interpretazione delle stime dei parametri

Il report Stime dei parametri mostra le seguenti informazioni:

I coefficienti del modello

I p-value per ogni parametro

Figura 5.29 Report Stime dei parametri 

Parameter Estimates Report

In questo esempio, i p-value sono tutti molto piccoli (<.0001). Ciò indica che tutti e tre gli effetti (grassi, carboidrati e proteine) contribuiscono significativamente alla previsione delle calorie.

È possibile utilizzare i coefficienti del modello per prevedere il valore delle calorie per specifici valori di grassi, carboidrati e proteine. Per esempio, supponiamo di voler prevedere le calorie medie per qualsiasi merendina che abbia le seguenti caratteristiche:

Fat = 11 g

Carbohydrate = 43 g

Protein = 2 g

Utilizzando questi valori, è possibile calcolare le calorie medie previste nel modo seguente:

277.92 = -5.9643 + 8.99*11 + 4.0975*43 + 4.4013*2

Le caratteristiche in questo esempio sono uguali a quelle della merendina Milky Way (a riga 59 della tabella di dati). Le calorie effettive di Milky Way sono 280, a dimostrazione che il modello esegue una previsione corretta.

Utilizzo del Profiler di previsione

Utilizzare il Profiler di previsione per osservare quali cambiamenti nei fattori influiscono sui valori previsti. Le linee del profilo mostrano la grandezza di cambiamento nelle calorie al variare dei fattori. La linea di Total fat g è la più verticale, per indicare che i cambiamenti nel grasso totale hanno gli effetti più ampi sulle calorie.

Figura 5.30 Profiler di previsione 

Prediction Profiler

Selezionare e trascinare la linea verticale per ciascun fattore per osservare come cambia il valore previsto. È anche possibile selezionare i valori dei fattori correnti e cambiarli. Per esempio, fare clic sui valori dei fattori e specificare i valori per la merendina Milky Way (riga 59).

Figura 5.31 Valori dei fattori di Milky Way 

Factor Values for the Milky Way

Nota: Per ulteriori informazioni sul Profiler di previsione, consultare Profilers.

Conclusioni

Il dietologo ha ora un ottimo modello per prevedere le calorie di una merendina in base alla quantità totale di grassi, carboidrati e proteine.

Vuoi maggiori informazioni? Hai domande? Ottieni risposte nella community di utenti JMP (community.jmp.com).