어떤 시리얼이 건강한 식단에 도움이 될까요? Cereal.jmp 표본 데이터(인기 시리얼 상자에서 수집한 실제 데이터)는 섬유질 함유량, 칼로리 및 기타 영양 정보에 대한 통계를 제공합니다. 가장 건강한 시리얼을 파악하기 위해 히스토그램 및 설명적인 통계, 상관관계 및 이상치 탐지, 산점도 및 군집 분석을 단계별로 해석합니다.
분포 플랫폼은 히스토그램, 추가 그래프 및 보고서를 사용하여 단일 변수(단변량 분석)의 분포를 보여 줍니다. 단변량은 두 개(이변량) 또는 여러 개(다변량)가 아닌 하나의 변수를 포함한다는 것을 의미합니다. 그러나 단일 보고서에서 여러 개별 변수의 분포를 검토할 수도 있습니다. 각 변수의 보고서 내용은 변수가 범주형(명목 또는 서열)인지 연속형인지에 따라 달라집니다.
참고: 분포 플랫폼에 대한 자세한 내용은 Basic Analysis 설명서의 Distributions 장을 참조하십시오.
1.
도움말 > 표본 데이터 라이브러리를 선택하고 Cereal.jmp를 엽니다.
2.
분석 > 분포를 선택합니다.
3.
Ctrl 키를 누르고 Manufacturer, Calories, FatFiber를 클릭합니다.
4.
Y, 열을 클릭한 후 확인을 클릭합니다.
제조업체, 칼로리, 지방 및 섬유질 분포
그래프에서 데이터 점 옆에 시리얼의 이름을 표시하기 위해 Cereal.jmp에서 Fiber One이 있는 행에 레이블이 지정됩니다. 전체 레이블을 표시하려면 가장 오른쪽 수직 경계선을 오른쪽으로 끌어 놓으십시오. 레이블이 없는 데이터 점에 커서를 놓으면 "All Bran with Extra Fiber"가 표시됩니다.
Nabisco 시리얼의 분포
섬유질이 많은 시리얼
고섬유질 저지방 시리얼
참고: 다변량 플랫폼에 대한 자세한 내용은 Multivariate Methods 설명서의 Correlations and Multivariate Techniques 장을 참조하십시오.
1.
Cereal.jmp 데이터 테이블에서 열 패널 상단에 있는 아래쪽 삼각형을 클릭하여 행을 선택 취소합니다(행 선택 취소).
행 선택 취소
2.
3.
Calories부터 Potassium까지 선택하고 Y, 열을 클릭한 후 확인을 클릭합니다.
상관관계 보고서
산점도 행렬의 일부
4.
다변량 빨간색 삼각형 메뉴에서 쌍별 상관관계를 선택하여 쌍별 상관관계 보고서를 표시합니다.
쌍별 상관관계 보고서의 일부
5.
상관관계가 높은 쌍을 빠르게 보려면 보고서를 마우스 오른쪽 버튼으로 클릭하고 열별 정렬, 유의성 확률, 오름차순 체크박스를 선택한 후 확인을 클릭합니다.
가장 관련성이 높은 쌍이 보고서 상단에 나타납니다. 쌍에 대한 작은 p-value는 상관관계의 증거를 나타냅니다. 가장 중요한 상관관계는 총 탄수화물과 칼로리 사이의 상관관계입니다.
쌍에 대한 작은 p-value
참고: 계층적 군집화에 대한 자세한 내용은 Multivariate Methods 설명서의 Hierarchical Cluster 장을 참조하십시오.
1.
Cereal.jmp가 표시된 상태에서 분석 > 군집 > 계층적 군집를 선택합니다.
2.
Calories부터 Enriched까지 선택하고 Y, 열을 클릭한 후 확인을 클릭합니다.
계층적 군집 보고서가 나타납니다. 계층적 군집 보고서의 일부은 보고서의 일부를 보여 줍니다. 데이터 테이블 행 상태에 따라 군집에 색상이 적용됩니다.
계층적 군집 보고서의 일부
3.
색상이 적용된 군집
1군의 유사한 시리얼
군집 선택
군집 요약
1군 특성