t-검정

t-검정이란?

t-검정(스튜던트 t-검정이라고도 함)은 가설 검정을 사용하여 하나 또는 두 모집단의 평균을 평가하는 도구입니다. 한 그룹이 알려진 값과 다른지 여부(1표본 t-검정), 두 그룹이 서로 다른지 여부(독립 2표본 t-검정), 쌍체 측정값에 유의한 차이가 있는지 여부(쌍체 또는 종속 표본 t-검정)를 평가하는 데 t-검정을 사용할 수 있습니다.

t-검정은 어떤 방법으로 사용하는가?

먼저 검정할 가설을 정의하고, 잘못 내린 결론을 용인할 수 있는 위험률을 지정합니다. 두 모집단을 비교하는 예를 들어보면, 두 모집단 평균이 같다는 가설을 세우고, 차이가 없을 때 차이가 존재한다는 결론을 내릴 위험을 용인할 수 있는 확률을 결정할 수 있습니다. 그런 다음, 데이터에서 검정 통계량을 계산하여 t 분포의 이론적 값과 비교합니다. 비교 결과에 따라 귀무가설을 기각하거나 인정합니다.

그룹이 세 개 이상일 때는 어떻게 하는가?

t-검정을 사용할 수 없습니다. 다중 비교 방법을 사용합니다. 다중 비교의 예로는 분산 분석(ANOVA), Tukey-Kramer 쌍벌 비교, Dunnett의 대조군 비교, 평균 분석(ANOM) 방법 등이 있습니다.  

t-검정 가정

t-검정은 가정으로부터 편차에 상대성이 강한 편이며 t-검정에서는 다음과 같이 가정합니다.

  • 데이터가 연속형이다.
  • 표본 데이터가 모집단에서 랜덤 표집되었다.
  • 분산에 동질성이 있다(즉, 각 그룹의 데이터 변동성이 유사하다).
  • 분포가 정규 분포에 가깝다.

2표본 t-검정의 경우 독립적인 표본이 있어야 합니다. 독립적이지 않은 표본에는 쌍체 t-검정이 적합할 수 있습니다.

t-검정의 유형

평균을 비교하는 t-검정은 세 가지로, 1표본 t-검정, 2표본 t-검정, 쌍체 t-검정이 있습니다. 아래 테이블에 각 검정의 특성이 정리되어 있고, 적절한 검정을 선택하는 방법이 안내되어 있습니다. 각 유형의 t-검정에 대해 설명하는 별도 페이지를 방문하여 가정 및 계산에 대한 자세한 정보와 예제를 확인하십시오.

 1표본 t-검정2표본 t-검정쌍체 t-검정
동의어스튜던트 t-검정
  • 독립 그룹 t-검정
  • 독립 표본 t-검정
  • 등분산 t-검정
  • 합동 t-검정
  • 이분산 t-검정
  • 쌍체 그룹 t-검정
  • 종속 표본 t-검정
변수의 개수122
변수의 유형
  • 연속형 측정값
  • 연속형 측정값
  • 그룹 정의에 사용되는 범주형 또는 명목형
  • 연속형 측정값
  • 그룹내 쌍 정의에 사용되는 범주형 또는 명목형
검정 목적모집단 평군이 특정 값과 동일한지 여부 판별다른 두 집단의 모집단 평균이 동일한지 여부 판별모집단의 쌍체 측정값 사이 차이가 0인지 여부 판별
검정 예시한 그룹의 평균 심박수가 65인지 여부두 그룹의 평균 심박수가 같은지 여부한 그룹의 운동 전후 심박수 평균 차이가 0인지 여부
모집단 평균 추정값표본 평균각 그룹의 표본 평균쌍체 측정값 차이의 표본 평균
모집단 표준편차알 수 없음, 표본 표준편차 사용알 수 없음, 각 그룹의 표본 표준편차 사용알 수 없음, 쌍체 측정값 차이의 표본 표준편차 사용
자유도표본의 관측값 수 -1 또는:
n–1
각 표본의 간측값 합계 -2 또는 n1 + n2 –2표본의 쌍체 관측값 수 -1 또는 n–1

위 테이블은 모집단 평균에 대한 t-검정만 보여줍니다. 또 하나의 일반적인 t-검정으로 상관 계수에 대한 검정이 있습니다.  이 t-검정은 상관 계수가 0과 유의하게 다른지 여부를 판별하는 데 사용됩니다. 

단측 검정과 양측 검정 비교

가설을 세울 때 단측 검정인지 아니면 양측 검정인지 여부도 정해야 합니다. 데이터를 수집하거나 계산을 수행하기 전에 이 결정을 내려야 합니다. 평균에 대한 세 가지 t-검정 모두에 대해 이 결정을 내립니다.

1표본 t-검정을 이용하여 설명해보겠습니다. 단백질바의 랜덤 표본이 있고 단백질바의 라벨에 개당 단백질 함량이 20그램으로 광고되어 있다고 가정합니다. 귀무가설은 알 수 없는 모집단 평균이 20이라는 것입니다. 여기서 단순히 데이터에 다른 모집단 평균도 있는지 확인하려 한다고 가정합니다. 이 경우에 가설은 다음과 같이 표현됩니다.

$ \mathrm H_o: \mu = 20 $

$ \mathrm H_a: \mu \neq 20 $

여기 양측 검정이 있습니다. 데이터를 이용하여 표본 평균의 차이가 유의한지(즉, 20보다 높거나 낮은지) 여부를 확인함으로써 알 수 없는 모집단 평균이 20이 아니라는 결론을 도출해보겠습니다.

그 대신 라벨의 광고가 정확한지 알고 싶다고 가정해봅니다. 데이터가 알 수 없는 모집단 평균이 최소 20이라는 가정을 뒷받침할까요? 그렇지 않을까요? 이 경우에 가설은 다음과 같이 표현됩니다.

$ \mathrm H_o: \mu >= 20 $

$ \mathrm H_a: \mu < 20 $

여기 단측 검정이 있습니다. 모집단 평균이 20 이상이라는 가설을 기각하기 위해 데이터를 이용하여 알 수 없는 표본 평균이 20보다 유의하게 작은지 확인해보겠습니다.

단측 검정과 양측 검정의 개념을 보여주는 이미지는 t 분포 페이지의 "가설 검정의 꼬리" 섹션을 참조하십시오.

t-검정을 수행하는 방법

분석에서 평균을 포함하는 모든 t-검정은 다음의 동일한 단계를 따릅니다.

  1. 데이터를 수집하기 전에 귀무가설($ \mathrm H_o $)과 대립가설($ \mathrm H_a $)을 정의합니다.
  2. 알파(α) 값을 결정합니다. 잘못된 결론을 내릴 것을 감수할 위험률을 결정하는 일이 여기에 포함됩니다. 예를 들어 두 독립적 그룹을 검정할 때 α=0.05로 설정했다고 가정합니다. 여기에서는 알 수 없는 모집단 평균이 실제로 같은데 다르다고 결론지을 위험률을 5%로 정했습니다.
  3. 데이터에 오류가 있는지 확인합니다.
  4. 검정에 대한 가정을 확인합니다.
  5. 검정을 수행하고 결론을 도출합니다. 평균에 대한 모든 t-검정에는 검정 통계량 계산이 포함됩니다. 검정 통계량을 t-분포의 이론 값과 비교합니다. 이론 값에는 α 값과 데이터 자유도가 모두 포함됩니다. 자세한 내용은 1표본 t-검정, 2표본 t-검정, 쌍체 t-검정에 대한 페이지에서 확인하십시오.