가설 검정에서 사용되는 가장 기초적인 방법 중 하나인 t-test가 무엇인지, 그리고 t-test의 종류에는 무엇이 있는지 알아보겠습니다.
t-test
목차
1. t-test란?
t-test(t 검정)는 모집단이 정규분포라는 사실을 알지만 모표준편차를 모를 때, 모집단의 평균을 추정하기 위해 모집단을 대표하는 표본으로부터 추정된 분산이나 표준편차를 사용하는 가설 검정 방식입니다.
모표준편차를 몰라서 정규 분포를 확실히 쓰지 못하는데 어떤 분포를 사용할까요? 바로 t분포를 사용합니다. t분포는 모집단의 표준편차를 사용하는 z분포와 다르게 표본의 표준편차를 기저로 만들어진 분포입니다.
표본의 표준편차를 활용해 만들어진 t분포는 t 분포는 자유도에 따라 그 모양이 조금씩 변합니다.
표본이 작을 때는 정규분포와 약간 다른 모습을 갖지만 표본의 크기가 커지면 중심극한정리에 따라 정규분포를 따릅니다.
그래서 t 검정은 표본의 크기가 작은 소표본인 경우에 주로 사용합니다.
t 검정은 "두 집단의 평균 차이가 없다."라는 귀무가설을 검정하는 방향으로 진행되며, 그 과정은
두 개의 단계로 나눌 수 있습니다. 1) 표본의 평균과 표준편차, 표본 크기를 활용해 t통계량(t값)을 계산합니다. 2) t 통계량이 t 분포 상에서 어느 정도 위치에 있는지 확인해보고, 해당 수치 혹은 그 이상의 결과가 나올 확률을 계산합니다.(p-value 계산)여기서 나온 p-value 값이 유의수준보다 작다면 귀무가설을 기각하고 연구가설을 채택합니다.
t 검정의 종류는 두 집단을 어떻게 정의하느냐에 따라 일 표본t 검정, 독립 표본 t 검정, 대응 표본 t 검정으로 나뉩니다.
2. 일 표본 t 검정
일 표본 t 검정은 모집단의 평균을 알고 있을 때 표본의 평균이 모집단의 평균과 같은지 검정합니다.
예를 들어 A 고등학교 학생들의 수능 평균 점수가 전체 수능 평균 점수와 비교했을 때 더 잘했는지 확인하는 과정을 일 표본 t 검정으로 볼 수 있습니다.
전체 수능 평균 점수는 모집단의 평균이고, A 고등학교 학생들의 수능 평균 점수는 1개의 표본이 됩니다.
그렇다면 귀무가설과 연구 가설은 아래와 같습니다.
귀무가설 | A 고등학교의 수능 평균 점수는 전체 수능 평균 점수와 같다. |
연구가설 | A 고등학교의 수능 평균 점수는 전체 수능 평균 점수와 다르다. |
3. 독립 표본 t 검정
독립 표본 t 검정은 서로 독립적인 두 개의 집단(표본)의 평균이 차이가 있는지 검정합니다. 여기서 제시한 두 개의 집단은 서로 연관이 없어야 합니다.
예를 들어 인터넷 강의를 들으면서 공부한 집단과 현장 강의를 들으면서 공부한 집단의 평균 시험 점수를 비교해 차이가 있는지 확인하는 과정을 독립 표본 t 검정으로 볼 수 있습니다.
귀무가설 | 인터넷 강의 집단과 현장 강의 집단의 평균 시험 점수는 같다. |
연구가설 | 인터넷 강의 집단과 현장 강의 집단의 평균 시험 점수는 같지 않다. |
4. 대응 표본 t 검정
대응 표본 t 검정은 서로 관련이 있는 두 개의 집단(표본)의 평균이 차이가 있는지 검정합니다. 대응 표본 t검정에서 두 집단은 독립 표본과 다르게 서로 관련이 되어있습니다. 한 집단의 사전/사후 비교가 대표적인 대응 표본 t 검정 예시입니다.
구체적으로 임상 시험에서 한 집단이 약을 섭취하기 전 평균 수면 시간과 약을 섭취한 후 평균 수면 시간의 차이를 비교할 때 대응 표본 t검정을 사용합니다.
귀무가설 | 약을 섭취하기 전 평균 수면 시간과 약을 섭취한 후 평균 수면 시간은 같다. |
연구가설 | 약을 섭취하기 전 평균 수면 시간과 약을 섭취한 후 평균 수면 시간은 다르다. |
지금까지 t 검정에 대해 알아보았습니다. t 검정은 모집단이 정규 분포인 것을 알고, 두 집단의 평균을 비교할 때 사용하는 것을 잊지 마세요!
추천 글
1종 오류, 2종 오류, 그리고 유의확률(P-value) (tistory.com)
1종 오류, 2종 오류, 그리고 유의확률(P-value)
연구실, 마케팅 현장 등 많은 곳에서 진리나 의사결정을 위해 가설 검정을 할 때 주의해야 할 오류들인 1종 오류, 2종오류가 있습니다. 그리고 1종 오류를 최소화하기 위한 기준인 유의확률도 있
johawk.tistory.com
'코드잇 스프린트 > 통계' 카테고리의 다른 글
차원 축소와 주성분 분석(Principle Component Analysis, PCA) (1) | 2024.09.19 |
---|---|
기술통계와 추론통계 (0) | 2024.08.22 |
사분위수 (0) | 2024.08.19 |
데이터 전처리 방법들 (0) | 2024.08.12 |
1종 오류, 2종 오류, 그리고 유의확률(P-value) (0) | 2024.08.08 |