t 분포
t 분포란?
t 분포는 모집단 표준편차를 알 수 없을 때 표본 평균과 모집단 평균 사이 표준화된 거리를 설명하며, 관측값은 정규 분포를 따르는 모집단에서 추출됩니다.
t 분포가 스튜던트 t 분포와 동일한가?
예.
t 분포와 z 분포 간 주요 차이점은 무엇인가?
표준 정규 분포 또는 z 분포에서는 모집단 표준편차를 알고 있다고 가정합니다. t 분포는 표본 표준편차를 근거로 합니다.
t 분포와 정규 분포 비교
t 분포는 정규 분포와 비슷합니다. 분포에 대한 정확한 수학적 정의가 내려져 있습니다. 복잡한 수학을 다루는 대신 t 분포의 유용한 특성과 분석에서 중요한 이유에 대해 알아보겠습니다.
- 정규 분포와 마찬가지로 t 분포의 모양도 매끄럽습니다.
- 정규 분포와 마찬가지로 t 분포도 대칭형입니다. 평균에서 반으로 접는다고 생각해보면 양쪽이 서로 동일할 것입니다.
- 표준 정규 분포(또는 z 분포)와 마찬가지로 t 분포의 평균도 0입니다.
- 정규 분포에서는 모집단 표준편차를 알고 있다고 가정합니다. t 분포에서는 이러한 가정을 내리지 않습니다.
- t 분포는 자유도에 의해 정의됩니다. 자유도는 표본 크기와 관련이 있습니다.
- t 분포는 모집단 표준편차를 알 수 없거나 두 가지 모두 적용될 때 작은 표본 크기에 가장 유용합니다.
- 표본 크기가 커질수록 t 분포가 정규 분포와 비슷해집니다.
다음 그래프에서 세 개의 t 분포와 하나의 표준 정규분포를 비교해 보여줍니다.
모든 분포가 매끄러운 형태를 보입니다. 모두 대칭형입니다. 모든 분포의 평균이 0입니다.
t 분포의 형태는 자유도에 따라 달라집니다. 자유도가 높은 곡선은 더 높이 올라가고 꼬리가 얇습니다. 세 가지 t 분포가 모두 z 분포보다 "더 두꺼운 꼬리"를 갖습니다.
자유도가 클수록 곡선이 z 분포에 더 근접하는 것을 알 수 있습니다. 자유도 1의 분홍색 곡선과 z 분포의 녹색 곡선을 비교합니다. 자유도 1의 t 분포는 z 분포보다 높이가 낮고 꼬리가 두껍습니다. 이제 자유도 10의 파란색 곡선과 z 분포의 녹색 곡선을 비교합니다. 두 가지 분포는 매우 유사합니다.
일반적으로 표본 크기가 30 이상인 경우 t 분포 대신 z 분포를 사용할 수 있습니다. 아래 그림 2는 자유도 30의 t 분포와 z 분포를 보여줍니다. 그림에서 z에 녹색 점선 곡선을 사용하여 두 곡선을 모두 볼 수 있습니다. 이러한 유사성은 표본 크기가 충분히 클 때 t 분포 대신 z 분포가 통계 방법으로 사용되는 한 가지 이유입니다.
가설 검정 및 t 분포의 꼬리
t 검정을 수행할 때 검정 통계량이 t 분포에서 기대한 값보다 더 심한 극단값인지 확인합니다.
양측 검정에서는 분포의 양쪽 꼬리를 살펴봅니다. 아래 그림 3은 양측 검정의 결정 프로세스를 보여줍니다. 곡선은 자유도 21의 t 분포입니다. α = 0.05/2 = 0.025인 t 분포의 값은 2.080입니다. 양측 검정의 경우, 검정 통계량이 참조값의 절대값보다 크면 귀무가설을 기각합니다. 검정 통계량 값이 아래쪽 꼬리 또는 위쪽 꼬리 중 하나에 있으면 귀무가설을 기각합니다. 그러나 두 참조선 안쪽에 검정 통계량이 있으면 귀무가설을 기각할 수 없습니다.
단측 검정에서는 분포의 한쪽 꼬리만 살펴봅니다. 예를 들어 아래 그림 4에서 단측 검정의 결정 프로세스를 보여줍니다. 곡선은 이번에도 자유도 21의 t 분포입니다. 단측 검정의 경우, α = 0.05의 t 분포 값은 1.721입니다. 검정 통계량이 참조값보다 크면 귀무가설을 기각합니다. 그러나 참조선 아래에 검정 통계량이 있으면 귀무가설을 기각할 수 없습니다.
t 테이블을 사용하는 방법
대부분 소프트웨어를 사용하여 t-검정을 수행합니다. 하지만 많은 통계 책자에 t 테이블이 실려 있으므로 테이블 사용법을 알면 유용할 것입니다. 아래 절차는 일반적인 t 테이블을 사용하는 방법을 설명합니다.
- 양측 검정과 단측 검정 중 어느 검정을 위한 테이블인지 확인합니다. 그런 다음, 수행할 검정이 양측 검정인지 단측 검정인지 판정합니다. t 테이블의 열에는 여러 가지 알파 수준이 정리되어 있습니다.단측 검정을 위한 테이블도 양측 검정에 사용할 수 있습니다. 양측 검정을 위해 α = 0.05로 설정했는데 단측 테이블만 있는 경우, α = 0.025에 해당하는 열을 사용합니다.
- 데이터의 자유도를 확인합니다. t 테이블의 행이 서로 다른 자유도에 해당합니다. 대부분의 테이블에서 자유도는 최대 30까지 상승하다 멈춥니다. 사람들이 큰 표본에는 z 분포를 사용할 것이라는 가정이 테이블에 적용되어 있습니다.
- 테이블에서 α 수준과 자유도가 교차하는 셀을 찾습니다. 해당 셀의 값이 t 분포 값입니다. 통계량을 t 값과 비교하여 적절한 결론을 내립니다.