작성
·
31
답변 2
0
안녕하세요! 루비네 코딩입니다^^
너무 좋은 질문에 감사합니다!
표본 한개에 대한 분산을 계산할 때에는 모평균은 정확하게 모르기 때문에 해당 표본의 평균을 중심으로 계산하게 됩니다.
그런데 해당 표본의 평균이 모평균과 같으라는 보장은 없습니다!
이러한 상황이 "감안"되어 분모에 n-1 이 있는 "불편 추정량"을 사용하게 됩니다.
(주의: n=표본의 개수가 아닌 한개 있는 표본의 "크기")
(주의: "감안"이라는 다소 느슨한 용어 사용에 대해서 양해 구합니다. 수학적으로 확인 가능합니다.)
그런데 이번에 질문주신 부분은 "표준오차"를 도출해 내기위한 "분산"인데요.
여기에서의 전제는 "개개 표본은 모집단의 특성을 갖는 n개의 독립적인 확률변수들을 샘플링한 것과 같이 만들어 졌다" 입니다.
그러면 "표본평균"을 나타내는 확률변수 𝑋 ̅ = 위에서 언급한 "독립적인 확률변수들의 합"/n 과 같습니다.
그렇기 때문에 𝐸[𝑋 ̅ ]= 모평균 이라는 것은 확률변수들의 특성을 사용해서 보장이 됩니다.
또한 Var(𝑋 ̅ ) = 모분산/n 이라는 것도 확률변수들의 독립성과 해당 모집단을 대표한다는 특성을 사용해서 보장이 됩니다.
그리고 모집단의 특성을 그대로 같는 (독립적인) 확률변수들에 대해서는 어떠한 보정도 필요 없습니다.
다시 정리해 보면: 표본 "한 개"의 분산을 계산할 때에는 불편추정량이 필요하고,
확률변수 𝑋 ̅ 의 분산을 계산할 때에는 모집단을 따르는 확률변수 그 자체의 특성을 사용하기 때문에 불편추정량이 필요없습니다.
확률변수 𝑋 ̅ 의 기댓값이나 분산을 계산한다는 것은 중심극한정리가 전제하는 것과 같이 표본을 거듭해서 추출하여 수렴하는 값이 되겠습니다.
조금이나마 이해에 도움이 되었으면 한는 바램입니다.
루비네 코딩 드림.
0
안녕하세요, 인프런 AI 인턴입니다. kccjjang님!
중심극한정리에서는 일반적으로 분산을 계산할 때 ‘모분산’을 기준으로 합니다. 이 경우, 분모를 n으로 나눕니다. 이는 모집단에서 표본을 추출하여 그 표본의 평균을 반복 실험하게 되면, 모집단의 분산을 n으로 나눈 값이 적용된다는 것을 의미합니다. 이는 중심극한정리가 표본 평균의 분포가 모집단의 평균에 가까워진다는 개념과 관련이 있습니다.
보통 ‘표본분산’을 계산할 때는 분모를 n-1로 나누는데, 이는 불편 추정량(unbiased estimator)을 사용하기 위함입니다. 하지만 중심극한정리에서 사용하는 분산은 모분산을 기반으로 하므로 n으로 나누는 것이 맞습니다.
이와 관련하여 더 상세한 설명이 필요한 경우, 아래의 링크에서 유사한 질문과 강사님의 답변을 확인해 보시기 바랍니다:
- 중심극한정리와 모분산
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.
자세한 설명 감사합니다.