1표본 t-검정
1표본 t-검정이란?
1표본 t-검정은 알 수 없는 모집단 평균이 특정 값과 다른지 여부를 판별하는 데 사용되는 통계적 가설 검정입니다.
카이제곱 적합도 검정은 언제 사용할 수 있는가?
연속형 데이터에 이 검정을 사용할 수 있습니다. 정규 모집단의 랜덤 표본에서 추출된 데이터여야 합니다.
데이터가 정규 분포를 제대로 따르지 않으면 어떻게 하는가?
표본 크기가 매우 작으면 정규성을 검정하지 못할 수도 있습니다. 본인의 데이터 이해력에 의존해야 할 수 있습니다. 정규성을 가정하는 것이 안전하지 않을 경우 비모수 검정을 수행할 수 있습니다.
1표본 t-검정 사용
아래 섹션에서는 검정 수행에 필요한 사항, 데이터 확인, 검정 수행 방법 및 통계 세부 정보에 대해 설명합니다.
검정에 필요한 사항은 무엇인가?
1표본 t-검정에 필요한 변수는 한 개입니다.
또한 모집단의 평균이 얼마의 값을 가진다는 가정 또는 가설도 세우고 있습니다. 다음은 두 가지 예입니다.
- 한 병원에 남성의 콜레스테롤 측정값 랜덤 표본이 있습니다. 대상 환자들에게서 콜레스테롤 이외의 징후들도 보였습니다. 그리고 높은 콜레스테롤에 대해 어떠한 약물도 복용하지 않고 있습다. 병원에서 알 수 없는 환자 집단의 평균 콜레스테롤 수치가 목표 수준인 200mg과 다른지 여부를 확인하려고 합니다.
- 에너지바 표본의 단백질 함량(g)을 측정합니다. 라벨에는 에너지바의 단백질 함량이 20g으로 명시되어 있습니다. 이 라벨이 정확한지 확인하려고 합니다.
1표본 t-검정 가정 사항
유효한 검정이 되려면 다음에 해당하는 데이터 값이 필요합니다.
- 독립성(서로 관련이 없는 값)
- 연속형
- 모집단의 단순 랜덤 표본을 통해 표집된 값
모집단도 정규 분포를 따르는 것으로 가정합니다.
1표본 t-검정 예제
일반 소비자에게 판매되는 에너지바 모집단을 나타내기 위해 몇몇 매장에서 31개의 에너지바 랜덤 표본을 추출했다고 가정합니다. 에너지바 라벨에는 개당 단백질 함량이 20그램으로 표기되어 있습니다.
테이블 1: 에너지바 랜덤 표본의 단백질 함량(g)
에너지바 - 단백질 함량(g) | ||||||
---|---|---|---|---|---|---|
20.70 | 27.46 | 22.15 | 19.85 | 21.29 | 24.75 | |
20.75 | 22.91 | 25.34 | 20.33 | 21.54 | 21.08 | |
22.14 | 19.56 | 21.10 | 18.04 | 24.12 | 19.95 | |
19.72 | 18.28 | 16.26 | 17.46 | 20.53 | 22.12 | |
25.06 | 22.44 | 19.08 | 19.88 | 21.39 | 22.33 | 25.79 |
위 테이블을 보면 단백질 함량이 20그램 미만인 에너지바가 몇 개 있습니다. 또 함량이 더 많은 것도 있습니다. 데이터가 라벨이 맞다는 가정을 뒷받침한다고 생각할 수 있습니다. 동의하지 않는 사람도 있을 것입니다. 통계적 검정은 합당한 의사결정 방법을 제공하여 누구나 동일한 데이터 집합에 관해 동일한 결정을 내릴 수 있도록 해줍니다.
데이터 확인
먼저 한 가지 질문의 답을 찾아 보겠습니다. t-검정이 에너지바의 단백질 함량이 20그램인지 검정하기에 적절한 방법일까요? 아래 목록은 검정 요구사항 점검표입니다.
- 데이터 값들은 독립적입니다. 한 에너지바의 단백질 함량(g)은 다른 에너지바의 단백질 함량과 관계가 없습니다. 하나의 생산 로트에서 에너지바를 수집한 경우가 종속 값의 예에 해당합니다. 단일 로트에서 수집한 표본은 일반적으로 에너지바가 아니라 해당 로트를 대표합니다.
- 데이터 값은 단백질 함량(g)입니다. 그리고 측정값은 연속형입니다.
- 여기서 에너지바는 일반 소비자에게 판매되는 에너지바 모집단(즉, 많은 에너지바 혼합군)에서 추출한 단순 랜덤 표본이라고 가정합니다.
- 표본이 수집되는 모집단이 정규 분포를 따른다고 가정하고, 대규모 표본을 대상으로 이 가정을 확인할 수 있습니다.
t-검정이 적절한 방법이라고 결정합니다.
분석으로 들어가기 전에 데이터를 빠르게 살펴보겠습니다. 아래 그림은 에너지바에 대한 히스토그램과 요약 통계량을 보여줍니다.
잠깐 살펴보면 매우 특이한 점들, 즉 이상치가 없음을 알 수 있습니다. 데이터가 종형에 가까우므로 정규 분포라는 가정은 합리적입니다.
통계량을 간단히 살펴보면 평균이 20보다 높은 21.40으로 나타납니다. 단백질바 31개 표본에서 구한 평균 값으로 인해 라벨에 표기된 알 수 없는 전체 모집단의 평균 단백질 함량 20그램 주장이 무효화될까요? 그렇지 않을까요?
1표본 t-검정을 수행하는 방법
t-검정 계산을 위해서는 평균, 표준편차, 표본 크기 정보가 필요합니다. 위 그림 1의 요약 통계량 섹션에 필요한 정보가 나와 있습니다.
통계량은 소수 자릿수 두 자리로 반올림합니다. 소프트웨어는 더 많은 소수 자릿수를 제시하며, 계산에도 그대로 사용합니다. (테이블 1에는 소수 자릿수가 두 자리만 표시됨에 주의하십시오. 요약 통계량 계산에 사용된 실제 데이터의 소수 자릿수는 더 많습니다)
먼저 표본 평균과 20 사이 차이를 구하는 것으로 시작하겠습니다.
$ 21.40-20\ =\ 1.40$
다음에는 평균의 표준 오차를 계산합니다. 계산식은 다음과 같습니다.
평균의 표준 오차 = $ \frac{s}{\sqrt{n}}= \frac{2.54}{\sqrt{31}}=0.456 $
위 그림 1에 제시된 값과 일치합니다.
이제 검정 통계량 산출에 필요한 모든 자료를 구했습니다. 검정 통계량은 다음과 같이 계산합니다.
$ t = \frac{\text{Difference}}{\text{Standard Error}}= \frac{1.40}{0.456}=3.07 $
결정을 내리기 위해 검정 통계량을 t- 분포의 값과 비교합니다. 이 작업은 다음 4단계로 진행됩니다.
- 검정 통계량을 계산합니다. 산출된 검정 통계량은 3.07입니다.
- 차이가 없는데 차이를 단언하기 위해 감수할 위험률을 결정합니다. 에너지바 데이터의 경우, 알 수 없는 평균 시험 모집단 평균의 차이가 실제와 달리 20이라고 말할 위험률 5%를 감수할 용의가 있다고 결정합니다. 통계량 측면에서 α = 0.05로 설정합니다. 실제로 데이터를 수집하기 전에 위험률(α)을 설정해야 합니다.
내린 결정에 따라 t 분포에서 값을 구합니다. t-검정에서 이 값을 구하려면 자유도 값이 필요합니다. 자유도는 표본 크기에 따라 결정됩니다. 에너지바 데이터의 자유도 계산식은 다음과 같습니다.
자유도 = $ n - 1 = 31 - 1 = 30 $
α = 0.05, 자유도 30인 t 임계값은 +/- 2.043입니다. 대부분의 통계량 서적에 t 분포 조회 테이블이 나와 있습니다. 온라인으로도 조회 테이블을 찾을 수 있습니다. 가장 가능성이 높은 상황은 인쇄된 서적의 테이블을 사용하지 않고 소프트웨어를 사용하는 것입니다.
검정 통계량(3.07) 값을 t 값과 비교합니다. 3.07 > 2.043이므로 단백질의 평균 함량(g)이 20과 같다는 귀무가설을 기각합니다. 라벨이 부정확하고 단백질의 모집단 평균 함량(g)이 20보다 크다는 실질적인 결론을 내립니다.
통계 상세 정보
통계 용어를 사용하여 에너지바 데이터와 1표본 t-검정을 살펴보겠습니다.
여기서 귀무가설은 기본 모집단 평균이 20이라는 것입니다. 귀무가설 표현식은 다음과 같습니다.
$ H_o: \mathrm{\mu} = 20 $
대립가설은 기본 모집단 평균이 20이 아니라는 것입니다. 단백질 20그램으로 표기된 라벨은 틀립니다. 다음과 같이 나타냅니다.
$ H_a: \mathrm{\mu} ≠ 20 $
양측 검정입니다. 양측 모집단 평균이 20그램과 다른지 검정하는 중입니다. 평균이 20그램이라는 귀무가설을 기각할 수 있으면 에너지바의 라벨이 틀렸다는 실질적인 결론을 내립니다. 귀무가설을 기각할 수 없다면 에너지바의 라벨이 정확할 수 있다는 실질적 결론을 내립니다.
표본의 평균을 계산한 다음, 모집단 평균 mu를 사용하여 차이를 계산합니다.
$ \overline{x} - \mathrm{\mu} $
다음과 같이 표준 오차를 계산합니다.
$ \frac{s}{ \sqrt{n}} $
계산식에서 표본 표준편차를 s, 표본 크기를 n으로 각각 표시합니다.
검정 통계량은 아래 계산식을 사용합니다.
$ \dfrac{\overline{x} - \mathrm{\mu}} {s / \sqrt{n}} $
그런 다음, 선택된 알파 값과 데이터 자유도를 갖는 t 값과 검정 통계량을 비교합니다. 예로 에너지바 데이터를 사용하며 α = 0.05로 설정합니다. 자유도(df)는 표본 크기에 따라 결정되며, 다음과 같이 계산합니다.
$ df = n - 1 = 31 - 1 = 30 $
통계학자들은 α = 0.05, 자유도 30인 t 값을 다음과 같이 표시합니다.
$ t_{0.05,30} $
α = 0.05, 자유도 30인 양측 검정의 t 값은 +/- 2.042입니다. 여기 비교에서 가능한 결과는 두 가지입니다.
- 검정 통계량이 임계 t 값보다 덜 극단적입니다. 즉, 검정 통계량이 -2.042보다 작거나 +2.042보다 크지 않습니다. 평균이 지정된 값과 같다는 귀무가설을 기각하지 못합니다. 예제에서 에너지바의 라벨을 바꿔야 한다는 결론을 내릴 수 없습니다.
- 검정 통계량이 임계 t 값보다 더 극단적입니다. 즉, 검정 통계량이 -2.042보다 작고 +2.042보다 큽니다. 평균이 지정된 값과 같다는 귀무가설을 기각합니다. 예제에서 라벨을 바꾸거나 평균적으로 단백질 함량을 20그램의 에너지바를 생산하도록 생산 공정을 개선해야 한다는 결론을 내립니다.
정규성 검정
정규성 가정은 크기가 큰 표본보다 작은 표본에 더 중요합니다.
정규 분포는 대칭으로, 중심에서 양쪽으로 "균등"하게 분포된 것을 의미입니다. 정규 분포에는 극단값 또는 이상치가 없습니다. 그래프를 통해 정규 분포의 두 가지 특징을 확인할 수 있습니다. 앞에서 에너지바 데이터가 정규성 가정 아래 진행할 수 있을 정도로 정규성에 "충분히 근접"한다는 결론을 내렸습니다. 아래 그림은 데이터에 대한 정규 분위수 그림을 보여주며, 앞에서 내린 결론을 뒷받침합니다.
소프트웨어를 사용하여 정형화된 정규성 검정을 수행할 수도 있습니다. 아래 그림은 JMP를 사용한 정규성 검정 결과를 보여줍니다. 정규 분포 가설을 기각할 수 없습니다.
에너지바 데이터가 정규 분포를 따른다는 가정 아래 진행할 수 있습니다.
내 데이터가 정규 분포를 따르지 않는 경우 어떻게 하나요?
표본 크기가 매우 작으면 정규성을 검정하기 어려울 수도 있습니다. 이러한 경우, 측정값에서 파악되는 정보를 활용해야 할 수도 있습니다. 에너지바 데이터를 예로 들면, 회사에서 단백질 함량(g)의 기본 분포가 정규 분포를 따른다는 사실을 알고 있습니다. 표본이 아주 작더라도 회사는 정규성을 가정하고 t-검정을 진행할 수 있습니다.
기본 측정값이 정규 분포를 따르지 않음을 알고 있으면 어떻게 할까요? 아니면 표본 크기가 크고 정규성 검정이 기각되면 어떻게 할까요? 이러한 상황에서는 비모수 검정을 사용할 수 있습니다. 비모수 분석은 특정 분포에서 데이터 값이 추출되었다는 가정에 의존하지 않습니다. 1표본 t-검정의 경우, 가능한 한 가지 비모수 검정은 Wilcoxon 부호 순위 검정입니다.
p 값 이해
시각화를 사용하여 검정 통계량이 분포에서 지정된 값보다 극단값을 보이는지 확인할 수 있습니다. 아래 그림은 자유도 30의 t 분포를 보여줍니다.
여기서 검정은 양측이고 α = 0.05로 설정하기 때문에 그림에서 2.042라는 값에 의해 결합된 꼬리에서 데이터의 5%가 "절단"됨을 알 수 있습니다.
다음 그림은 그 결과를 보여줍니다. 검정 통계량이 지정된 임계값보다 위에 있는 것을 알 수 있습니다. 평균이 20과 같다는 가설을 기각하기에 "꼬리에서 이탈"한 정도가 충분합니다.
소프트웨어에 모든 사항 통합
소프트웨어를 사용하여 t-검정을 수행할 수 있습니다. 아래 그림은 JMP 소프트웨어의 에너지바 데이터에 대한 1표본 t-검정의 결과를 보여줍니다.
소프트웨어에 귀무가설 값 20과 데이터에서 산출되는 평균 및 표준편차가 표시됩니다. 검정 통계량은 3.07로, 위의 계산과 일치하는 값입니다.
소프트웨어에서 보여주는 결과는 양측 검정 결과와 단측 검정 결과입니다. 여기에서 원하는 것은 양측 검정입니다. 귀무가설은 단백질의 평균 그램 수가 20과 같다이고, 대립가설은 단백질의 평균 그램 수가 20g과 같지 않다는 것입니다. 소프트웨어에서 보여주는 값은 양측 검정의 p 값 0.0046입니다. 이 p 값은 기본 모집단 평균이 실제로 20일 때 표본 평균이 21.4에 이르는 극단값을 보일 가능도, 다시 말해서 표본에서 관측한 평균과 다르거나 혹은 모집단 평균 20과 훨씬 다른 표본 평균이 관측될 확률을 설명합니다. p 값이 0.0046이면 10,000을 기준으로 가능한 횟수가 대략 46임을 의미합니다. 따라서 모집단 평균이 20과 같다는 귀무가설을 의심없이 기각할 수 있습니다.