계속 헷갈리고 잊어먹어서 정리.
표본 분포에서 표본 분산에 대한 분포인 카이제곱분포를 사용하려면
일단 Random Sample들이 정규분포에 대한 i.i.d가 만족되어야 한다.
따라서 표본 분산을 통해서 카이제곱분포를 사용하는 경우, 각 표본들이 정규분포를 따르는지 무조건 체크해봐야 된다.
표본 평균이 아니라!! 표본 자체가 정규분포를 따라야됨.
n이 30이상이고 어쩌고 상관 없다. 이건 표본 평균(CLT)에 대해 다룰때.
1. 모집단이 정규분포를 따라야 함
모집단 X가 평균 μ, 분산 σ2를 갖는 정규분포 N(μ,σ2)를 따라야 한다. 이는 카이제곱 분포의 성질이 정규분포에서 파생되기 때문.
2. 독립적이고 동일한 분포의 표본
정규분포를 따르는 모집단으로부터 크기가 n인 표본이 독립적이고 동일한 분포 (i.i.d.)를 가져야 한다.
표본분산이 카이제곱분포로 표현되기 위해서는 모집단이 정규분포를 따라야 하며, 표본들이 독립적이고 동일한 정규분포에서 추출되어야 한다.
3. 표본의 정규성 확인을 무조건 해야 하는 상황
1) 표본 분산을 통해 카이제곱 분포를 사용하려고 하는 경우
2) 제곱합 기반 통계량 사용하는 경우.
제곱합은 일반적으로 카이제곱(혹은 비중심 카이제곱) 분포를 따른다고 하는데
이는 표본이 정규분포를 따를 때 성립하는 이야기
4. 정규성 확인
1) QQ플롯 및 히스토그램
2) shapiro-wilk, kolmogorov-smirnov 검정 등 다양한 통계 검정
5. 정규성이 무조건 필요해서 변환해야 할 때
로그 변환, 제곱근 변환 등 각종 변환등을 활용해보자.
'Statistics' 카테고리의 다른 글
Statistics. 대수의 법칙, 수렴속도와 베이지안 (0) | 2024.08.16 |
---|---|
Statistics. Random Sample, Data Set (0) | 2024.08.15 |
Probabilistic Thinking. 베이지안, 리스크 관리, 헷징, 장기적 관점 (0) | 2024.08.15 |