히스토그램은 연속형 변수의 분포를 파악하는 데 가장 유용한 그래픽 도구 중 하나입니다. 히스토그램을 사용하여 데이터에서 다음 정보를 찾을 수 있습니다.
• 평균 값 및 변동
• 극단값
그림 4.2 히스토그램의 예
열 머리글에 있는 히스토그램 아이콘을 클릭하면 곧바로 히스토그램을 볼 수 있습니다. 이 히스토그램은 열 머리글 아래에 표시됩니다.
그림 4.3 즉석 히스토그램
이 예에서는 특정 회사 그룹의 수익 데이터가 포함된 Companies.jmp 데이터 테이블을 사용합니다.
재무 분석가가 다음과 같은 질문에 대한 답을 구하려고 합니다.
• 일반적으로 각 회사는 얼마나 많은 수익을 올립니까?
• 평균 수익은 얼마입니까?
• 다른 회사에 비해 극단적으로 높거나 낮은 수익을 올리는 회사가 있습니까?
이러한 질문에 답하려면 Profits ($M)의 히스토그램을 사용합니다.
1. 도움말 > 샘플 데이터 폴더를 선택하고 Companies.jmp를 엽니다.
2. 분석 > 분포를 선택합니다.
3. Profits ($M)를 선택하고 Y, 열을 클릭합니다.
그림 4.4 Profits ($M)의 분포 창
4. 확인을 클릭합니다.
그림 4.5 Profits ($M)의 히스토그램
이 히스토그램에서는 다음을 알 수 있습니다.
• 대부분의 회사는 수익이 -1,000달러 ~ 1,500달러 사이입니다.
하나를 제외한 모든 막대가 이 범위에 있습니다. 또한 수익이 0달러 ~ 500달러 범위에 있는 회사가 가장 많습니다. 해당 범위를 나타내는 막대가 다른 모든 막대보다 훨씬 깁니다.
• 평균 수익은 500달러보다 약간 적습니다.
상자 그림에 있는 마름모의 중심은 평균 값을 나타냅니다. 여기서는 평균이 500달러보다 약간 낮습니다.
• 한 회사는 다른 회사들보다 훨씬 더 높은 수익을 올리고 있어 이상치로 간주될 수 있습니다. 이상치는 다른 데이터 점의 일반적인 패턴과 동떨어져 있는 데이터 점입니다.
이 이상치는 히스토그램의 상단에 하나의 매우 짧은 막대로 표시됩니다. 이 작은 막대는 소규모 그룹(여기서는 단일 회사)을 나타내며 나머지 히스토그램 막대와 상당히 동떨어져 있습니다.
이 보고서에는 히스토그램 외에도 다음이 포함됩니다.
• 데이터의 또 다른 그래픽 요약인 상자 그림. 상자 그림에 대한 자세한 내용은 Essential Graphing의 에서 확인하십시오.
• 분위수 및 요약 통계량 보고서 이러한 보고서에 대해서는 "분포 분석"에서 설명합니다.
JMP에서 데이터 테이블과 보고서는 모두 연결되어 있습니다. 히스토그램 막대를 클릭하면 데이터 테이블에서 해당 행이 선택됩니다.