¿Qué cereales forman parte de una dieta saludable? La muestra de datos Cereal.jmp (datos reales recopilados de las cajas de cereales más populares) presenta estadísticos sobre el contenido en fibra, calorías y otra información nutricional. Para identificar los cereales más saludables, interpretará, paso a paso, histogramas y estadísticos descriptivos, correlaciones y detección de valores atípicos, gráficos de dispersión y análisis de conglomerado.
La plataforma Distribución ilustra la distribución de una única variable (análisis univariante) mediante histogramas, gráficos adicionales e informes. El término univariante significa, simplemente, que se implica una variable en lugar de dos (bivariante) o varias (multivariante). No obstante, puede examinar la distribución de varias variables individuales dentro de un único informe. El contenido del informe para cada variable cambia en función de si la variable es categórica (nominal u ordinal) o continua.
Nota: Para conocer todos los detalles acerca de la plataforma Distribución, consulte el capítulo Distributions del libro Basic Analysis.
1.
|
2.
|
Seleccione Análisis > Distribución.
|
3.
|
4.
|
Para mostrar el nombre del cereal junto a un punto de datos en los gráficos, se etiqueta la fila que contenga Fiber One en Cereal.jmp. Para ver la etiqueta completa, arrastre el borde vertical de la derecha hacia la derecha. Coloque el cursor sobre el punto de datos sin etiquetar para ver “All Bran with Extra Fiber”.
7.
|
Consejo: Deje abierto el informe Distribuciones. Lo utilizará posteriormente en un análisis de conglomerado. Consulte “Analizar valores similares”.
Nota: Para conocer más detalles acerca de la plataforma Multivariante, consulte el capítulo Correlations and Multivariate Techniques del libro Multivariate Methods.
1.
|
En la tabla de datos Cereal.jmp, haga clic en el triángulo invertido situado en la parte superior del panel Columnas para deseleccionar las filas (Deseleccionar filas).
|
2.
|
Seleccione Análisis > Métodos multivariantes > Multivariante.
|
3.
|
Seleccione desde Calories hasta Potassium, haga clic en Y, Columnas y, a continuación, haga clic en Aceptar.
|
Las elipsis de densidad que se muestran en la matriz de gráficos de dispersión ilustran con más detalle las relaciones existentes entre variables. Una parte de la matriz de gráficos de dispersión muestra una parte del gráfico.
4.
|
Seleccione Correlaciones por pares del menú con triángulo rojo de Multivariante para que se muestre el informe Correlaciones por pares.
|
5.
|
Para ver rápidamente qué pares guardan una alta correlación, haga clic con el botón derecho en el informe y seleccione Ordenar por columna, Prob. de significación y la casilla de verificación Ascendente; a continuación, haga clic en Aceptar.
|
Lo pares que tienen una correlación más alta aparecen al principio del informe. Los valores p bajos de los pares son un indicio de correlación. La correlación más significativa se produce entre Tot Carbo (carbohidratos totales) y Calories.
Valores p bajos de los pares
Nota: Para conocer todos los detalles acerca del conglomerado jerárquico, consulte el capítulo Hierarchical Cluster del libro Multivariate Methods.
1.
|
2.
|
Seleccione desde Calories hasta Enriched, haga clic en Y, Columnas y, a continuación, haga clic en Aceptar.
|
Aparece el informe Conglomeración jerárquica. Una parte del informe Conglomeración jerárquica muestra una parte del informe. Los conglomerados muestran colores en función de los estados de las filas de la tabla de datos.
3.
|
Seleccione Colorear conglomerados en el menú con triángulo rojo de Conglomeración jerárquica.
|
5.
|
Para ver las características similares del conglomerado, seleccione Resumen de conglomerado en el menú con triángulo rojo.
|