인프런 영문 브랜드 로고
인프런 영문 브랜드 로고

인프런 커뮤니티 질문&답변

김치현님의 프로필 이미지
김치현

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

독립표본검정

독립표본검정에서요

해결된 질문

작성

·

55

0

두 집단의 분산이 같은지 다른지 여부를 모를때

 

  1. shapiro 검정을 통해 정규성 만족 여부 확인

1-1) 정규성을 만족한다면

levene 검정을 통해 등분산 검정을 한다. 등분산 검정 시 0.05보다 크다면 귀무가설 채택(등분산이다) 0.05보

다 작으면 대립가설 채택(등분산이 아니다)

 

1-2) ttest_ind 진행

stats.ttest_ind(a,b,equal_var = True) <- 레빈검정 귀무채택시

stats.ttest_ind(a,b,equal_var = False) <- 레빈검정 귀무기각 시

 

  1. 정규성을 만족하지 않는다면

stats.manwhitneyu(a,b,alternative = 'less') 진행

 

문의내용

  1. 위 순서로 진행하는게 맞는건지 문의드리며

  2. 만 휘트니 검정할때는 만 휘트니 검정 자체가 정규성 불만족할때의 ttest와 같다고 생각하면 되는건지 문의드립니다.

 

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

이해를 돕기위해 순서대로 알려드렸고,

순서는 맞지만 이 중 1개만 문제가 출제 됩니다.

작업형3은 정답이 있는 문제입니다.

 

ex)

manwhitneyu(비모수 검정)을 하라고 한다면 manwhitneyu 검정을 진행해 주세요!

0

안녕하세요, 인프런 AI 인턴입니다. 김치현님께서 질문하신 독립표본검정과 관련된 내용을 요약 및 추가 설명 드리겠습니다.

  1. 독립표본검정 진행 순서:

    • 먼저, Shapiro-Wilk 검정을 통해 데이터가 정규성을 만족하는지 확인합니다. 이 검정의 결과가 0.05보다 크다면 귀무가설을 채택하여 데이터가 정규성을 만족한다고 간주합니다.
    • 만약 정규성을 만족한다면, Levene 검정을 사용하여 두 집단의 분산이 동일한지를 확인합니다. Levene 검정의 p-value가 0.05보다 크면 등분산이 가정되고, 작으면 등분산 가정이 부품됩니다.
    • 등분산이 가정될 때와 아닐 때 각각 ttest_ind를 진행합니다. equal_var=True는 등분산을 가정하고, equal_var=False는 등분산을 가정하지 않을 때 사용됩니다.
  2. 정규성을 만족하지 않는 경우:

    • 정규성을 만족하지 않는 경우에는 Mann-Whitney U 검정을 사용합니다. 이 검정은 정규성을 가정하지 않는 비모수 검정으로, 두 그룹의 순위 차이를 비교하여 검정합니다.
  3. Mann-Whitney U 검정과 t-test의 관계:

    • Mann-Whitney U 검정은 정규성을 가정하지 않는 상황에서 사용 가능한 대체 검정입니다. 이는 정규성 가정 하에서 t-test를 수행할 수 없을 때 대안으로 사용됩니다.

이와 같은 절차는 데이터 분석에서 매우 일반적으로 사용되는 방법입니다. 지금 진행하신 방법은 상당히 정확하다고 할 수 있습니다. 추가적인 설명이나 구체적인 예시로 이해를 돕고 싶다면 아래의 유사한 질문과 답변을 참고해 보세요.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

김치현님의 프로필 이미지
김치현

작성한 질문수

질문하기