데이터 시각화 > 단변량 그래프의 단일 변수 분석 > 연속형 변수에 히스토그램 사용
발행일 : 08/23/2023

연속형 변수에 히스토그램 사용

히스토그램은 연속형 변수의 분포를 파악하는 데 가장 유용한 그래픽 도구 중 하나입니다. 히스토그램을 사용하여 데이터에서 다음 정보를 찾을 수 있습니다.

평균 값 및 변동

극단값

그림 4.2 히스토그램의 예 

Example of a Histogram

즉석 히스토그램

열 머리글에 있는 히스토그램 아이콘을 클릭하면 곧바로 히스토그램을 볼 수 있습니다. 이 히스토그램은 열 머리글 아래에 표시됩니다.

그림 4.3 즉석 히스토그램 

Instant Histograms

시나리오

이 예에서는 특정 회사 그룹의 수익 데이터가 포함된 Companies.jmp 데이터 테이블을 사용합니다.

재무 분석가가 다음과 같은 질문에 대한 답을 구하려고 합니다.

일반적으로 각 회사는 얼마나 많은 수익을 올립니까?

평균 수익은 얼마입니까?

다른 회사에 비해 극단적으로 높거나 낮은 수익을 올리는 회사가 있습니까?

이러한 질문에 답하려면 Profits ($M)의 히스토그램을 사용합니다.

히스토그램 생성

1. 도움말 > 샘플 데이터 폴더를 선택하고 Companies.jmp를 엽니다.

2. 분석 > 분포를 선택합니다.

3. Profits ($M)를 선택하고 Y, 열을 클릭합니다.

그림 4.4 Profits ($M)의 분포 창 

Distribution Window for Profits ($M)

4. 확인을 클릭합니다.

그림 4.5 Profits ($M)의 히스토그램 

Histogram of Profits ($M)

히스토그램 해석

이 히스토그램에서는 다음을 알 수 있습니다.

대부분의 회사는 수익이 -1,000달러 ~ 1,500달러 사이입니다.

하나를 제외한 모든 막대가 이 범위에 있습니다. 또한 수익이 0달러 ~ 500달러 범위에 있는 회사가 가장 많습니다. 해당 범위를 나타내는 막대가 다른 모든 막대보다 훨씬 깁니다.

평균 수익은 500달러보다 약간 적습니다.

상자 그림에 있는 마름모의 중심은 평균 값을 나타냅니다. 여기서는 평균이 500달러보다 약간 낮습니다.

한 회사는 다른 회사들보다 훨씬 더 높은 수익을 올리고 있어 이상치 간주될 수 있습니다. 이상치는 다른 데이터 점의 일반적인 패턴과 동떨어져 있는 데이터 점입니다.

이 이상치는 히스토그램의 상단에 하나의 매우 짧은 막대로 표시됩니다. 이 작은 막대는 소규모 그룹(여기서는 단일 회사)을 나타내며 나머지 히스토그램 막대와 상당히 동떨어져 있습니다.

이 보고서에는 히스토그램 외에도 다음이 포함됩니다.

데이터의 또 다른 그래픽 요약인 상자 그림. 상자 그림에 대한 자세한 내용은 Essential Graphing의 에서 확인하십시오.

분위수요약 통계량 보고서 이러한 보고서에 대해서는 "분포 분석"에서 설명합니다.

히스토그램에서의 상호 작용

JMP에서 데이터 테이블과 보고서는 모두 연결되어 있습니다. 히스토그램 막대를 클릭하면 데이터 테이블에서 해당 행이 선택됩니다.

더 많은 정보를 원하십니까? 질문이 있습니까? JMP 사용자 커뮤니티에서 답변 받기 (community.jmp.com).