카이제곱 검정

카이제곱 검정이란 무엇인가?

카이제곱 검정은 가설 검정 방법입니다. 두 가지 일반적인 카이제곱 검정에는 하나 이상의 범주에서 관측된 빈도가 기대 빈도와 일치하는지 확인하는 단계가 포함됩니다.

카이제곱 검정은 χ² 검정과 동일한가?

그렇습니다. χ가 그리스어로 카이(Chi)입니다.

어떠한 종류의 검정이 있나요?

측정 변수가 한 개이면 카이제곱 적합도 검정을 사용합니다. 측정 변수가 두 개이면 카이제곱 독립성 검정을 사용합니다. 그 밖에 카이제곱 검정도 있지만 이 두 가지 검정이 가장 일반적입니다.

카이제곱 검정의 종류

데이터가 예상한 대로인지 여부에 대한 가설 검정에 카이제곱 검정을 사용합니다. 검정의 기본 개념은 데이터에서 관측값을 귀무가설이 참인지 확인할 기대값과 비교하는 것입니다.

흔히 사용되는 두 가지 카이제곱 검정은 카이제곱 적합도 검정카이제곱 독립성 검정입니다. 두 검정 모두 데이터를 여러 가지 범주로 나누는 변수를 포함합니다. 그래서 사람들이 사용할 검정을 결정하기 혼란스러울 수 있습니다. 아래 테이블에 두 검정이 비교되어 있습니다.

각 유형의 카이제곱 검정에 대해 설명하는 별도 페이지를 방문하여 가정 및 계산에 대한 자세한 정보와 예제를 확인하십시오.

테이블 1: 카이제곱 검정 선택

 

카이제곱 적합도 검정

카이제곱 독립성 검정

변수의 개수12
검정 목적하나의 변수가 주어진 분포에서 나올 가능성이 있는지 여부 판별두 변수가 서로 관련될 수 있는지 여부 판별
예제캔디 봉지에 맛별로 동일한 수의 캔디가 들어 있는지 여부 판별영화 관람객의 간식류 구매 결정이 감상하려고 하는 영화의 장르와 관련이 있는지 여부 판별
예제에서의 가설

Ho: 캔디의 맛 종류 비율이 동일함

Ha: 맛 종류 비율이 동일하지 않음

Ho: 간식류 구매자 비율이 영화 장르와 무관함

Ho: 간식류 구매자 비율이 영화 장르별로 다름

검정에 사용된 이론적 분포카이제곱카이제곱
자유도

범주 개수 - 1

  • 예제에서는 캔디의 맛 종류 수 - 1

첫 번째 변수의 범주 개수 - 1의 값에 두 번째 변수의 범주 개수 -1의 값을 곱한 결과

  • 예제에서는 영화 범주의 개수 -1의 값에 1을 곱한 결과(간식류 구매는 예/아니오 변수로 2 - 1 = 1이기 때문에 1을 곱함)

 

카이제곱 검정을 수행하는 방법

카이제곱 적합도 검정카이제곱 독립성 검정, 두 가지 모두에서 아래 나열된 동일한 분석 절차를 밟습니다. 분석 절차의 진행 과정을 보려면 각 검정 유형에 대한 페이지를 방문하십시오.

  1. 데이터를 수집하기 전에 귀무가설과 대립가설을 정의합니다.
  2. 알파 값을 결정합니다. 잘못된 결론을 내릴 것을 감수하는 위험을 결정하는 일이 여기에 포함됩니다. 예를 들어 독립성을 검정할 때 α=0.05로 설정했다고 가정합니다. 여기에서는 두 변수가 실제로 무관하지 않은데 서로 독립적이라는 결론을 내릴 위험을 5%로 정했습니다.
  3. 데이터에 오류가 있는지 확인합니다.
  4. 검정에 대한 가정을 확인합니다. (가정에 대한 자세한 내용은 각 검정 유형에 대한 페이지를 참조하십시오)
  5. 검정을 수행하고 결론을 도출합니다.


위 테이블의 카이제곱 검정에는 모두 검정 통계량 계산이 포함됩니다. 검정의 기본 개념은 실제 데이터 값을 귀무가설이 참일 경우 기대되는 값과 비교하는 것입니다. 검정 통계에는 실제 데이터 값과 기대 데이터 값 사이 제곱 차이를 구해서 그 차이를 기대 데이터 값으로 나누는 계산이 포함됩니다. 각 데이터 점에 대해 이 작업을 수행하고 값들을 합산해 나갑니다.

그런 다음, 검정 통계량을 카이제곱 분포의 이론 값과 비교합니다. 이론 값은 알파 값과 데이터 자유도, 모두의 영향을 받습니다. (자세한 예제를 보려면 각 검정 유형에 대한 페이지를 참조하십시오)