범주형(순서형 또는 명목형) 변수를 분석할 때는 수준 수 및 각 수준의 데이터 점 수와 같은 질문을 던질 수 있습니다.
• 변수에는 몇 개의 수준이 있습니까?
• 각 수준에는 몇 개의 데이터 점이 있습니까?
• 데이터가 균등하게 분포되어 있습니까?
• 각 수준이 차지하는 비율은 어느 정도입니까?
연속형 변수의 분포의 시나리오를 수행하면 철도 회사에서 자동차의 평균 중량이 목표 중량과 유의하게 다르지 않다고 판단했음을 알 수 있습니다. 그러나 해결해야 할 질문이 더 있습니다. 계획 전문가는 철도 회사의 다음 질문에 대답하고자 합니다.
• 자동차의 종류는 무엇입니까?
• 원산지 국가는 어디입니까?
이러한 질문에 답하려면 Type 및 Country 분포를 보십시오.
1. 도움말 > 샘플 데이터 폴더를 선택하고 Car Physical Data.jmp를 엽니다.
2. 분석 > 분포를 선택합니다.
3. Country 및 Type을 선택하고 Y, 열을 클릭합니다.
4. 확인을 클릭합니다.
그림 5.9 Country 및 Type 분포
보고서 창에는 Country 및 Type에 대한 막대 차트와 "빈도" 보고서가 있습니다. 막대 차트는 빈도 보고서에서 제공된 빈도 정보를 그래픽으로 나타낸 것입니다. "빈도" 보고서에는 다음 항목이 포함됩니다.
• 데이터의 범주. 예를 들어 "Japan"은 "Country"의 범주이고 "Sporty"는 "Type"의 범주입니다.
• 각 범주의 총 수
• 각 범주가 차지하는 전체 대비 비율
예를 들어 경차("Compact")는 22대가 있으며 116개의 관측값 중 약 19%를 차지합니다.
한 차트에서 막대를 선택하면 다른 차트에서 해당하는 데이터가 선택됩니다. 예를 들어 "Country" 막대 차트에서 "Japan" 막대를 선택하면 많은 수의 일본 자동차가 스포츠카인 것을 볼 수 있습니다.
그림 5.10 일본 자동차
"Other" 범주를 선택하면 이러한 자동차의 대다수가 소형("Small") 또는 경차("Compact")이고 대형("Large")은 거의 없음을 알 수 있습니다.
그림 5.11 기타 국가의 자동차