t-검정
t-검정이란?
t-검정(스튜던트 t-검정이라고도 함)은 가설 검정을 사용하여 하나 또는 두 모집단의 평균을 평가하는 도구입니다. 한 그룹이 알려진 값과 다른지 여부(1표본 t-검정), 두 그룹이 서로 다른지 여부(독립 2표본 t-검정), 쌍체 측정값에 유의한 차이가 있는지 여부(쌍체 또는 종속 표본 t-검정)를 평가하는 데 t-검정을 사용할 수 있습니다.
t-검정은 어떤 방법으로 사용하는가?
먼저 검정할 가설을 정의하고, 잘못 내린 결론을 용인할 수 있는 위험률을 지정합니다. 두 모집단을 비교하는 예를 들어보면, 두 모집단 평균이 같다는 가설을 세우고, 차이가 없을 때 차이가 존재한다는 결론을 내릴 위험을 용인할 수 있는 확률을 결정할 수 있습니다. 그런 다음, 데이터에서 검정 통계량을 계산하여 t 분포의 이론적 값과 비교합니다. 비교 결과에 따라 귀무가설을 기각하거나 인정합니다.
그룹이 세 개 이상일 때는 어떻게 하는가?
t-검정을 사용할 수 없습니다. 다중 비교 방법을 사용합니다. 다중 비교의 예로는 분산 분석(ANOVA), Tukey-Kramer 쌍벌 비교, Dunnett의 대조군 비교, 평균 분석(ANOM) 방법 등이 있습니다.
t-검정 가정
t-검정은 가정으로부터 편차에 상대성이 강한 편이며 t-검정에서는 다음과 같이 가정합니다.
- 데이터가 연속형이다.
- 표본 데이터가 모집단에서 랜덤 표집되었다.
- 분산에 동질성이 있다(즉, 각 그룹의 데이터 변동성이 유사하다).
- 분포가 정규 분포에 가깝다.
2표본 t-검정의 경우 독립적인 표본이 있어야 합니다. 독립적이지 않은 표본에는 쌍체 t-검정이 적합할 수 있습니다.
t-검정의 유형
평균을 비교하는 t-검정은 세 가지로, 1표본 t-검정, 2표본 t-검정, 쌍체 t-검정이 있습니다. 아래 테이블에 각 검정의 특성이 정리되어 있고, 적절한 검정을 선택하는 방법이 안내되어 있습니다. 각 유형의 t-검정에 대해 설명하는 별도 페이지를 방문하여 가정 및 계산에 대한 자세한 정보와 예제를 확인하십시오.
1표본 t-검정 | 2표본 t-검정 | 쌍체 t-검정 | |
---|---|---|---|
동의어 | 스튜던트 t-검정 |
|
|
변수의 개수 | 1 | 2 | 2 |
변수의 유형 |
|
|
|
검정 목적 | 모집단 평군이 특정 값과 동일한지 여부 판별 | 다른 두 집단의 모집단 평균이 동일한지 여부 판별 | 모집단의 쌍체 측정값 사이 차이가 0인지 여부 판별 |
검정 예시 | 한 그룹의 평균 심박수가 65인지 여부 | 두 그룹의 평균 심박수가 같은지 여부 | 한 그룹의 운동 전후 심박수 평균 차이가 0인지 여부 |
모집단 평균 추정값 | 표본 평균 | 각 그룹의 표본 평균 | 쌍체 측정값 차이의 표본 평균 |
모집단 표준편차 | 알 수 없음, 표본 표준편차 사용 | 알 수 없음, 각 그룹의 표본 표준편차 사용 | 알 수 없음, 쌍체 측정값 차이의 표본 표준편차 사용 |
자유도 | 표본의 관측값 수 -1 또는: n–1 | 각 표본의 간측값 합계 -2 또는 n1 + n2 –2 | 표본의 쌍체 관측값 수 -1 또는 n–1 |
위 테이블은 모집단 평균에 대한 t-검정만 보여줍니다. 또 하나의 일반적인 t-검정으로 상관 계수에 대한 검정이 있습니다. 이 t-검정은 상관 계수가 0과 유의하게 다른지 여부를 판별하는 데 사용됩니다.
단측 검정과 양측 검정 비교
가설을 세울 때 단측 검정인지 아니면 양측 검정인지 여부도 정해야 합니다. 데이터를 수집하거나 계산을 수행하기 전에 이 결정을 내려야 합니다. 평균에 대한 세 가지 t-검정 모두에 대해 이 결정을 내립니다.
1표본 t-검정을 이용하여 설명해보겠습니다. 단백질바의 랜덤 표본이 있고 단백질바의 라벨에 개당 단백질 함량이 20그램으로 광고되어 있다고 가정합니다. 귀무가설은 알 수 없는 모집단 평균이 20이라는 것입니다. 여기서 단순히 데이터에 다른 모집단 평균도 있는지 확인하려 한다고 가정합니다. 이 경우에 가설은 다음과 같이 표현됩니다.
$ \mathrm H_o: \mu = 20 $
$ \mathrm H_a: \mu \neq 20 $
여기 양측 검정이 있습니다. 데이터를 이용하여 표본 평균의 차이가 유의한지(즉, 20보다 높거나 낮은지) 여부를 확인함으로써 알 수 없는 모집단 평균이 20이 아니라는 결론을 도출해보겠습니다.
그 대신 라벨의 광고가 정확한지 알고 싶다고 가정해봅니다. 데이터가 알 수 없는 모집단 평균이 최소 20이라는 가정을 뒷받침할까요? 그렇지 않을까요? 이 경우에 가설은 다음과 같이 표현됩니다.
$ \mathrm H_o: \mu >= 20 $
$ \mathrm H_a: \mu < 20 $
여기 단측 검정이 있습니다. 모집단 평균이 20 이상이라는 가설을 기각하기 위해 데이터를 이용하여 알 수 없는 표본 평균이 20보다 유의하게 작은지 확인해보겠습니다.
단측 검정과 양측 검정의 개념을 보여주는 이미지는 t 분포 페이지의 "가설 검정의 꼬리" 섹션을 참조하십시오.
t-검정을 수행하는 방법
분석에서 평균을 포함하는 모든 t-검정은 다음의 동일한 단계를 따릅니다.
- 데이터를 수집하기 전에 귀무가설($ \mathrm H_o $)과 대립가설($ \mathrm H_a $)을 정의합니다.
- 알파(α) 값을 결정합니다. 잘못된 결론을 내릴 것을 감수할 위험률을 결정하는 일이 여기에 포함됩니다. 예를 들어 두 독립적 그룹을 검정할 때 α=0.05로 설정했다고 가정합니다. 여기에서는 알 수 없는 모집단 평균이 실제로 같은데 다르다고 결론지을 위험률을 5%로 정했습니다.
- 데이터에 오류가 있는지 확인합니다.
- 검정에 대한 가정을 확인합니다.
- 검정을 수행하고 결론을 도출합니다. 평균에 대한 모든 t-검정에는 검정 통계량 계산이 포함됩니다. 검정 통계량을 t-분포의 이론 값과 비교합니다. 이론 값에는 α 값과 데이터 자유도가 모두 포함됩니다. 자세한 내용은 1표본 t-검정, 2표본 t-검정, 쌍체 t-검정에 대한 페이지에서 확인하십시오.