Visualizzazione dei dati > Confronto di variabili multiple > Confronto di più variabili utilizzando grafici a dispersione
Data di pubblicazione: 08/23/2023

Confronto di più variabili utilizzando grafici a dispersione

Il grafico a dispersione è il più semplice fra tutti i grafici con più variabili. Utilizzare grafici a dispersione per determinare la relazione fra due variabili continue e scoprire se due variabili continue sono correlate. La correlazione indica quanto strettamente sono correlate due variabili. Quando sono presenti due variabili strettamente correlate, una potrebbe influenzare l'altra. Oppure, entrambe potrebbero essere influenzate da altre variabili in modo analogo.

Figura 4.9 Esempio di un grafico a dispersione 

Example of a Scatterplot

Scenario

Questo esempio utilizza la tabella di dati di esempio Companies.jmp, che contiene cifre di vendita e numero dei dipendenti di un gruppo di società.

Un analista finanziario desidera dare una risposta alle seguenti domande:

Qual è la relazione fra le vendite e il numero dei dipendenti?

La quantità delle vendite aumenta in funzione del numero dei dipendenti?

Si possono prevedere le vendite medie dal numero dei dipendenti?

Per rispondere a tali domande, utilizzare un grafico a dispersione di Sales ($M) rispetto a # Employ.

Creazione del grafico a dispersione

1. Selezionare Guida > Cartella dati di esempio e aprire Companies.jmp.

2. Selezionare Analizza > Stima Y rispetto a X.

3. Selezionare Sales ($M) e Y, Risposta.

4. Selezionare # Employ e X, Fattore.

Figura 4.10 Finestra Stima Y rispetto a X 

Fit Y by X Window

5. Fare clic su OK.

Figura 4.11 Grafico a dispersione di Sales ($M) rispetto a # Employ 

Scatterplot of Sales ($M) versus # Employ

Interpretazione del grafico a dispersione

Una società ha un elevato numero di dipendenti e vendite consistenti, rappresentata dal singolo punto nella parte superiore destra del grafico. La distanza fra questo punto di dati e tutto il resto rende difficoltosa la visualizzazione della relazione fra le restanti società. Rimuovere il punto dal grafico e ricrearlo eseguendo le seguenti operazioni:

1. Fare clic sul punto per selezionarlo.

2. Selezionare Righe > Nascondi ed escludi. Il punto di dati è nascosto e non viene più compreso nei calcoli.

Nota: la differenza fra nascondere ed escludere è importante. Nascondere un punto significa rimuoverlo da qualsiasi grafico nonostante i calcoli statistici continuino a utilizzarlo. Escludere un punto significa rimuoverlo da qualsiasi calcolo statistico senza rimuoverlo dai grafici. Quando si nasconde ed esclude un punto, esso viene rimosso da tutti i calcoli e da tutti i grafici.

3. Per ricreare il grafico senza l'outlier, fare clic sul triangolo rosso associato a Bivariato e selezionare Ripeti > Ripeti analisi. È possibile chiudere la finestra originale del report.

Figura 4.12 Grafico a dispersione con l'outlier rimosso 

Scatterplot with the Outlier Removed

Il grafico a dispersione aggiornato fornisce le seguenti risposte:

Esiste una relazione fra le vendite e il numero dei dipendenti.

I punti di dati hanno un pattern evidente. Non sono sparsi casualmente all'interno del grafico. È possibile tracciare una linea diagonale che si avvicina alla maggior parte dei punti di dati.

Le vendite si incrementano in funzione del numero dei dipendenti e la relazione è lineare.

Se si tracciasse la linea diagonale, si inclinerebbe dal basso a sinistra verso l'alto a destra. Questa inclinazione mostra che quando il numero dei dipendenti aumenta (da sinistra verso destra sull'asse inferiore), anche le vendite aumentano (dal basso verso l'alto sull'asse di sinistra). Una linea retta si avvicinerebbe alla maggior parte dei punti di dati indicando una relazione lineare. Se si dovesse curvare la linea per avvicinarla ai punti di dati, esisterebbe comunque una relazione (a causa del pattern dei punti). Tuttavia, non si tratterebbe di una relazione lineare.

È possibile prevedere le vendite medie dal numero dei dipendenti.

Il grafico a dispersione mostra che le vendite generalmente aumentano in funzione del numero dei dipendenti. Sarebbe possibile prevedere le vendite di una società se si conoscesse il numero dei dipendenti di tale società. La previsione sarebbe su tale linea immaginaria. Non sarebbe esatta ma si avvicinerebbe alla realtà.

Interazione con il grafico a dispersione

Come nel caso di altri grafici di JMP, il grafico a dispersione è interattivo. Passare il mouse sul punto nell'angolo inferiore destro per visualizzare il numero di riga e i valori x e y.

Figura 4.13 Passare il mouse su un punto 

Hover Over a Point

Fare clic su un punto per evidenziare la riga corrispondente nella tabella di dati. Selezionare più punti eseguendo le seguenti operazioni:

Fare clic e trascinare il cursore sui punti. In tal modo si selezionano i punti in un'area rettangolare.

Selezionare lo strumento Lazo e fare clic ed effettuare il trascinamento su più punti. Lo strumento Lazo seleziona un'area di forma irregolare.

Vuoi maggiori informazioni? Hai domande? Ottieni risposte nella community di utenti JMP (community.jmp.com).