inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

독립표본검정

대응표본검정 레빈

2

rosana8831

작성한 질문수 8

0

정규성, 등분산 O: ttest_ind

정규성O, 등분산 X: ttest_ind, equal_val=False

 

정규성x일때 맨 휘트니라고 배웠는데,

레빈->ttest_ind, equal_val=False 하신 이유는 무엇인가요?

 

정규성과, 등분산 언급이 없을 때 일까요?

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 1

0

인프런 AI 인턴

안녕하세요, 인프런 AI 인턴입니다. rosana8831님.

먼저, 대응표본 검정과 관련된 내용을 정리해보겠습니다.

대응표본 t-검정 절차

  1. 정규성 검정: 데이터셋이 정규성을 만족하는지 확인하기 위해 Shapiro-Wilk 검정을 사용합니다.

    • 정규성을 만족하면 t-검정을 진행할 수 있습니다.
    • 정규성을 만족하지 않으면 비모수 검정인 Mann-Whitney U 검정을 사용합니다.
  2. 등분산성 검정: 정규성을 만족한다고 가정할 때, Levene 검정을 통해 두 집단의 분산이 동일한지를 확인합니다.

    • 등분산이 있을 경우: ttest_ind를 사용하여 검정을 수행합니다.
    • 등분산이 없을 경우: ttest_indequal_var=False 옵션을 사용합니다.

질문에 대한 해석

  • Levene 검정 후 ttest_indequal_val=False를 사용한 이유는, 원래는 등분산성을 보장하지 않는 경우에 사용하는 방법입니다. 즉, Levene 검정 결과 분산이 같지 않다고 판단되었을 때 해당 옵션을 사용합니다.

  • 정규성과 등분산에 대한 언급이 없을 때:

    • 일반적으로 문제에서 명시되지 않은 경우 기본적으로 등분산성을 가정할 수 있으며, 교재나 강의에 따라 상황에 맞게 진행할 수 있습니다. 특정한 지시사항이 없는 한, 문제의 지문에 따라 분석 방법을 선택해야 합니다.

관련 자료

아래의 유사 질문들은 추가적인 정보와 설명을 제공합니다. 이들을 통해 다양한 검정 방법의 사용 사례와 이해를 얻을 수 있습니다:

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

단일표본검정 문제 유형

0

9

2

[작업형 3] 6~7. 카이제곱 검정

0

10

2

9회 작업형3 문제 1-1

0

14

2

최종답안 계산 방식 질문

0

11

1

시험 치기 전 급하게 질문 사항

0

19

2

유형3

0

19

2

작업형 2 연습문제 섹션 3

0

13

2

11 기출문제 ipynb파일

0

17

2

작업형 3 유형

0

18

2

11회 기출 유형(작업형1) 2번 정답

0

17

2

f1 score 질문

0

17

2

10회 작업형 2 인코딩 질의

0

13

2

53번 강의에서 갑자기 수업노트가 없어졌습니다.

0

19

2

28:19 roc_auc이유

0

18

2

수강연장문의

0

19

2

전체적인 머신러닝 순서

0

22

2

빅분기 실기 유형2질문

0

24

1

ID 전처리 이유

0

31

2

데이터제공

0

29

2

예시문제 작업형3 꼬리질문2번

0

21

1

데이터 개수를 구할 때, len과 value_counts 차이

0

28

2

작업형 2 제출방

0

21

2

인코딩 스케일링 순서

0

21

2

실제 시험에서도 공식을 문제에서 주는지

0

22

2