inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

대응표본검정

shapiro 검정을 하는 경우, 반드시 정규성을 따르지 않는 것 아닌가요?

해결된 질문

513

aprilminji

작성한 질문수 17

0

현재 독립표본검정 - 단일표본검정, 대응표본검정까지

들었습니다.

 

문제에 '정규분포에 따른다'는 말이 없으면

shapiro 검정을 통해 정규분포를 따르는지, 아닌지부터 따져야 하는데 현재 강의의 예는 정규분포를 따르지 않는 것만 있는 것 같아서 확인 차 여쭙습니다.

 

shapiro 검정 결과 정규분포를 따를 때에는

문제에 정규분포를 따른다고 할 때와 같이 wilcoxon이 아닌 ttest로 검정하는것 맞을까요 ?

 

 

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 2

1

퇴근후딴짓

네 정규분포를 따른다면 모수검정인 ttest로 진행하는 것이 맞아요!

정규분포를 따르지 않는 경우 비모수 검정 wilcoxon을 진행합니다.

그런데 우리가 분석을 서술형으로 하면 검정을 시도하고, 실험하고, 결과를 해석하고 순차적으로 진행하나

빅분기는 단답이에요!

shapiro, wilcoxon, ttest 중 1개의 검정을 특정하는 문제가 출제될 가능서이 큽니다.

0

인프런 AI 인턴

안녕하세요, 인프런 AI 인턴입니다.

aprilminji님의 질문에 대해 제공된 정보를 기반으로 답변드리겠습니다.

Shapiro-Wilk 검정은 데이터의 정규성을 확인하는 통계 검정 방법입니다. 이 검정을 통해 데이터가 정규분포를 따르는지 아닌지를 판단할 수 있으며, 이 결과에 따라 적절한 통계 검정 방법을 선택하는 것이 중요합니다.

정규성을 따르는 경우:
- 일반적으로 데이터가 정규분포를 따르는 것으로 판단된 경우(Shapiro-Wilk 검정 결과 p-value가 0.05보다 크게 나옴), 독립 두 집단 간 비교 시 등분산 여부를 확인한 후 t-test(ttest_ind)를 사용합니다. 등분산을 가정할 수 있다면 ttest_ind 함수의 equal_var=True 옵션을 사용하고, 등분산을 가정할 수 없는 경우 equal_var=False 옵션을 사용합니다.

정규성을 따르지 않는 경우:
- 데이터가 정규분포를 따르지 않는 것으로 판단된 경우(Shapiro-Wilk 검정 결과 p-value가 0.05보다 작게 나옴), 비모수 검정 방법을 사용합니다. 독립 두 집단간의 비교는 Mann-Whitney U 검정(mannwhitneyu), 대응 있는 두 집단의 비교는 Wilcoxon 부호 순위 검정(wilcoxon)을 사용하는 것이 일반적입니다.

질문하신 내용에 기반하여, Shapiro-Wilk 검정 결과 데이터가 정규분포를 따를 때 t-test로 검정하는 것이 맞습니다. 반면, 정규분포를 따르지 않을 경우 Wilcoxon이나 다른 비모수 검정 방법을 사용해야 합니다.

대응표본 t-검정에서 정규성 검정 문의에서 관련된 답변을 찾아볼 수 있습니다. 이 답변에서는 대응표본 t-검정 문제에서 정규성 검정을 언제 수행해야 하는지에 대해 설명하고 있으며, 특정 조건 하에서 어떤 검정 방법을 사용해야 하는지에 대한 지침을 제공합니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

단일표본검정, 샤피로검정, 윌콕슨검정

0

3

1

강의자료 다운로드 여부

0

2

1

문제에 첨부된 예시와 실제 출력된 샘플 비교

0

10

2

원핫 인코딩 관련

0

20

2

타겟 분리

0

17

2

Id 삭제

0

20

2

roc_auc_score 질문: 작업형2 모의문제3 09분 48초

0

18

2

원핫인코딩 코드 질문

0

17

2

map 함수 사용 필수적인가요

0

24

2

수강 기한 연장 문의드립니다.

0

29

2

34강 평가지표

0

27

2

103강 작업2형 전처리(레이블인코딩 부분) 오류

0

20

2

작업형1_section14 문의

0

17

2

작업형1_연습문제 7번 관련입니다.

0

19

2

데이터 프레임 슬라이싱 혹은 데이터 선택하기가 어렵습니다.

0

18

2

크로스 밸리데이션 질문

0

23

2

로지스틱 회귀분석 질문

0

21

2

수치형 데이터만 선택하여 푸는 경우에 오답확률이 높아질까요?

0

27

2

2유형 object 컬럼 인코딩 관련 질문

0

39

2

하이퍼파라미터 변수

0

35

2

52강 이원분산분석

0

29

2

실제시험환경에서 작업형1,2,3의 문제풀이 순서

0

37

2

독립표본검정

0

27

2

tranform을 쓰라는 힌트는 어디서 얻을 수 있나요??

0

40

2