inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

독립표본검정

대응표본검정 레빈

해결된 질문

24

rosana8831

작성한 질문수 9

0

정규성, 등분산 O: ttest_ind

정규성O, 등분산 X: ttest_ind, equal_val=False

 

정규성x일때 맨 휘트니라고 배웠는데,

레빈->ttest_ind, equal_val=False 하신 이유는 무엇인가요?

 

정규성과, 등분산 언급이 없을 때 일까요?

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 3

0

퇴근후딴짓

레빈 검정은 "정규성이 있을 때" 등분산 여부를 추가로 판단하는 검정입니다.

정규성 O + 등분산 Ottest_ind(equal_var=True)

정규성 O + 등분산 Xttest_ind(equal_var=False)Welch's t-검정

정규성 Xmannwhitneyu()

0

rosana8831

실제 기출에서 어떤 식으로 나오는 지 궁금합니다!

정확한 검정지표?를 주는 지 궁금합니다.

 

 

0

퇴근후딴짓

네 맞습니다. 제가 흐름을 설명하긴 했지만

분석하시오!!와 같은 서술형 문제가 아니라

특정 검정을 수행하는 문제입니다. 정답이 있는 문제여서 명확하게 명시합니다.

0

인프런 AI 인턴

안녕하세요, 인프런 AI 인턴입니다. rosana8831님.

먼저, 대응표본 검정과 관련된 내용을 정리해보겠습니다.

대응표본 t-검정 절차

  1. 정규성 검정: 데이터셋이 정규성을 만족하는지 확인하기 위해 Shapiro-Wilk 검정을 사용합니다.

    • 정규성을 만족하면 t-검정을 진행할 수 있습니다.
    • 정규성을 만족하지 않으면 비모수 검정인 Mann-Whitney U 검정을 사용합니다.
  2. 등분산성 검정: 정규성을 만족한다고 가정할 때, Levene 검정을 통해 두 집단의 분산이 동일한지를 확인합니다.

    • 등분산이 있을 경우: ttest_ind를 사용하여 검정을 수행합니다.
    • 등분산이 없을 경우: ttest_indequal_var=False 옵션을 사용합니다.

질문에 대한 해석

  • Levene 검정 후 ttest_indequal_val=False를 사용한 이유는, 원래는 등분산성을 보장하지 않는 경우에 사용하는 방법입니다. 즉, Levene 검정 결과 분산이 같지 않다고 판단되었을 때 해당 옵션을 사용합니다.

  • 정규성과 등분산에 대한 언급이 없을 때:

    • 일반적으로 문제에서 명시되지 않은 경우 기본적으로 등분산성을 가정할 수 있으며, 교재나 강의에 따라 상황에 맞게 진행할 수 있습니다. 특정한 지시사항이 없는 한, 문제의 지문에 따라 분석 방법을 선택해야 합니다.

관련 자료

아래의 유사 질문들은 추가적인 정보와 설명을 제공합니다. 이들을 통해 다양한 검정 방법의 사용 사례와 이해를 얻을 수 있습니다:

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

기출 11회 작업형 2_전체 데이터 학습 여부

0

15

1

예측값 결과 소수점 차이

0

21

2

기출 문제와 실전챌린지 연습문제 무엇부터 푸는게 나은가요?

0

14

0

전처리 train() test([ ])

0

16

2

작업형 1 배경지식 질문

0

19

2

옳게 풀은건지 질문드립니다!

0

14

1

roc_auc_score

0

23

2

추가질문 합니다

0

17

2

시험환경 구름

0

18

2

2유형 질문드려요

0

16

2

RandomForest vs lgb

0

23

2

전처리 관련질문

0

24

3

작업형3 기출

0

17

2

유형2에서 데이터분할 생략 가능여부

0

30

2

9회 기출 유형3 질문

0

19

2

lgb 기초편

0

14

1

괄호 사용

0

23

2

작업형 2 데이터 전처리 질문

0

21

1

11회 기출 유형 작업형1 문제 3-1

0

20

1

예시문제 작업형2 (ver2023) 질문입니다

0

20

2

Data type에 따른 처리

0

20

2

데이터 전처리 관련

0

19

2

시험에서 문제 불러오기

0

20

2

2번문제 출력값 질문

0

27

2