표집분포(Sampling distribution)
sampling과 sample은 다르다.
sample을 여러번 반복하는 것이 sampling이다.
표집분포는 추리통계의 가설검증을 위한 이론적 분포이다.
모집단의 분포에 상관없이 표본의 크기 n이 커질수록 표본평균 $\overline X$의 분포가 모집단의 분포에 상관없이 정규분포이다.
중심극한정리
모집단의 평균, 분산, 표준편차를 알고싶지만 비용이 과대하게 든다.
모집단에서 n을 표본으로 추출하고 평균, 분산을 구할 수 있다. 그러나 한번 sample 추출한 것으로 모집단의 분포를 추정할 수 없다. $\overline X_1, \overline X_2, \overline X_3 ...$등 여러번 계속적으로 추출하여 표본의 평균을 구하고 평균의 평균을 구하면 모집단의 평균과 같다. $ E( \overline X )= \mu $
표본에서 추출한 평균들의 분포가 정규분포를 이룬다는 표집분포에서 모집단의 평균과 표본의 평균에는 오차가 있다. 오차의 정도에 따라 정규분포가 이루는 종모양이 달라진다. 평균들의 편차, 표준오차(Standard Error)가 작으면 표본평균이 모평균에 가까이 있어 모평균을 더 잘 예측한다고 할 수 있다.
중심극한정리에서 분산은 모집단의 시그마 제곱이 있다면 n으로 나누어라 인데 혹시 모집단의 분산을 모른다면 대략적으로 표본에 근거해 찾을 수 있다.
중심극한정리 증명을 위한 재료, 테일러 급수
to be updated
by 표집분포와 중심극한정리, 확률과 통계개념+실력완성, Park, Ph.D