inflearn logo
강의

講義

知識共有

確率と統計 101

相関性分析

피셔의 z변환 질문

解決済みの質問

494

seungsab7894

投稿した質問数 1

0

피셔의 z변환은 어떻게 해서 나온것인가요?

어떻게 해서 저런 식이 나왔죠?

그리고 정규분포를 따른다는게 정확히 따른다는 말인가요(식도 동일한 형태) 아니면 정규분포의 형태를 따른다는 것인가요? (평균에 대해 빈도수가 높고 평균을 기준으로 멀어질 수록 빈도가 줄어들며 대략적으로 대칭인 정규분포와 비슷한 형태)

python 빅데이터 확률과-통계

回答 2

1

루비네코딩

안녕하세요:

중요한 질문에 감사합니다 ^^

1). 피셔의 z 변환의 필요성.

"중심극한정리"에서 알아 보았듯이 일반적인 경우 (표본으로 계산한 통계량)/(표준 오차)의 분포는

표본의 크기가 커질수록 표준정규분포를 따른다는 전제를 할 수 있습니다.

이 특성을 바탕으로 신뢰구간을 도출해 낼 수 있습니다. (Section 3, "구간추정" 참고, 강의자료 71p ~ 72p).

그런데, 상관계수는 [-1, +1] 구간에 속해야 하기 때문에 가장자리 (-1 또는 +1)에 가까울

수록 상관계수의 분포는 일그러져 정규분포에서 벗어난 형상을 보입니다.

결과적으로 (표본으로 계산한 상관계수)/(표준 오차) 또한 표준정규분포에서 벗어난 형상을 보입니다.

그러니까 -1과 +1의 위치에는 상관계수가 지나갈 수 없는 "벽" 또는 "테두리"가 있다고 상상해 볼 수 있습니다. (Section 3, 강의자료 93p ~ 94p 그림 참고).

신뢰구간을 만들려면 상관계수의 분포가 정규분포와 "유사한" 형상이 되도록 변환이 필요합니다.

그 역할을 피셔의 z 변환이 담당하게 됩니다.

상관계수의 분포는 피셔의 z 변환 이후 "테두리"의 영향이 줄어들고 정규분포에 "근접한" 형상을 보이게 됩니다.

2). 상관계수의 분포는 피셔의 z 변환이후 "정확하게" 정규분포를 따르는가?

아닙니다. 역쌍곡선 탄젠트 (atctanh)를 사용하는 피셔의 변환은 단지 테두리 (-1과 +1)의 영향을 줄여주는 효과를 보입니다.

"중심극한정리" 조차도 "정확하게" 정규분포를 따른다는 주장을 하고 있지는 않습니다. 단지 "중심" 부분에서 정규분포로 "근접" (approximate)할 수 있다는 주장을 하고 있습니다.

다소 어려운 주제인데 조금이나마 학습 하시는데 도움이 되시기를 바래 봅니다.

감사합니다.

Ruby네 코딩~

0

communityai8509

안녕하세요, 인프런 AI 인턴입니다.

진승섭님,

피셔의 z 변환(Fisher’s z-transformation)은 상관 계수를 r에서 정규 분포에 가까운 z값으로 변환하는 방법입니다. 이 변환은 특히 작은 샘플 크기에서도 상관 계수의 분포를 정규 분포에 가깝게 만들어 주는 좋은 성질을 가지고 있습니다.

피셔의 z 변환 유도

피셔의 z 변환 공식은 다음과 같습니다:
[ z = \frac{1}{2} \ln \left( \frac{1 + r}{1 - r} \right) ]

이 공식은 상관 계수 r을 변환하여 정규 분포의 특성을 확보하는 방법입니다. 이때, r은 -1에서 1 사이의 값을 가지며, z 값은 실수 전체에 걸쳐 퍼져 있습니다.

정규 분포를 따른다는 뜻

피셔의 z 변환이 정규 분포를 ‘따른다’는 것은 다음과 같은 의미를 가집니다:
- 변환된 z 값이 정규 분포의 형태를 따릅니다.
- 평균 0과 분산 (\frac{1}{n-3})을 가지는 정규 분포입니다.

즉, 변환된 z값은 평균에 대해 빈도수가 높고, 평균을 기준으로 멀어질수록 빈도가 줄어드는 대칭적 형태를 갖춘 정규 분포에 가깝다는 의미입니다.

정확한 내용이나 공식 등 추가적인 질문이 있으면 수강 전 문의 게시판에서 질문을 남기시면 더욱 자세한 답변을 받으실 수 있습니다.

감사합니다.

작업형 1 유형 부분

0

9

1

수강평 이벤트

0

16

2

작업형 1 (삭제예정, 구 버전)

0

28

2

강의노트는 어디있나요?

0

17

1

노션 학습 자료 권한 요청

0

15

1

수강기간 연장 문의드립니다.

0

20

1

2유형 레이블 인코딩 VS 원핫 인코딩

0

21

3

part2강의 문의사항입니다.

0

19

2

수강기간 연장 문의드립니다.

0

26

1

인덱스 슬라이싱

0

27

2

코드를 첨부해야하는 이유가 있나요?

0

20

2

소리가 겹쳐서 들려요

0

19

2

데스크톱과 노트북 연결

0

26

1

맥북 환경구성 에러

0

19

2

dict, zip

0

21

2

노션 : 파트3번 링크와 권한 , 파트4번 권한요청, 파트 5번도 미리 요청 드립니다.

0

27

4

6-6 실습 문의

0

23

2

미션 06-02

0

24

2

yes24 수집 md 파일 만들 때

0

24

2

python main.py 실행시 게임이 실행이 안돼요

0

27

2

antigravity 대신 cursor를 활용해도 되나요?

0

25

1

뉴스 검색 분류 한도초과

0

36

2

표본의 분위수 구하는 방법

0

81

1

증심극한정리

1

87

2