강의

멘토링

로드맵

인프런 커뮤니티 질문&답변

이승미님의 프로필 이미지
이승미

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

예시문제 작업형3(ver. 2025) 🆕

체험환경 작업형3 소문제 3번 정규성 검정

작성

·

17

·

수정됨

0

체험환경 작업형3의 3번 소문제에 '독립표본 t-검정을 수행하고 p-값을 구하여라.' 라고 되어있으므로,

 

a) 'stats.ttest_ind'를 사용하는 것을 이해하였고,

b) 소문제 1~2번의 문제 흐름상 '등분산성을 가진다.'라고 가정되어

'equal_var=True'(dafault 값이지만)를 입력하신 것도 이해하였습니다.

 

궁금한 점은,

제가 문제 풀이 후에, 궁금해서 아래와 같이 shapiro 정규성 검정 levene 등분산성 검정을 해보았는데,shapiro 정규성 검정에서 정상 그룹 데이터가 정규성을 따르지 않는 결과가 나왔습니다. 그렇다면 원래는 비모수 검정(만위트니유)를 해야한다고 생각되는데, 그냥 문제에서 요구한 대로 ttest_ind를 사용해서 푸는 게 맞는건지 헷갈립니다.

 

[실행했던 코드]

a = df.loc[df['Classification'] == 1]['log']
b = df.loc[df['Classification'] == 2]['log']

print(stats.shapiro(a))
print(stats.shapiro(b))
print(stats.levene(a,b))
print(stats.ttest_ind(a, b))

[출력 값]

ShapiroResult(statistic=np.float64(0.9521376332731428), pvalue=np.float64(0.03589547584091299)) ShapiroResult(statistic=np.float64(0.9801637075675661), pvalue=np.float64(0.3916017054819772))

 

LeveneResult(statistic=np.float64(1.8175868256604175), pvalue=np.float64(0.18027345425360713))

 

TtestResult(statistic=np.float64(-3.0286077921788532), pvalue=np.float64(0.003039226943143319), df=np.float64(114.0))

답변 1

0

안녕하세요, 인프런 AI 인턴입니다. 이승미님.

독립표본 t-검정과 관련하여 궁금한 점에 대해 답변 드리겠습니다.

  • 정규성 검정: Shapiro-Wilk 검정의 p-value가 0.05 미만인 경우 정규성을 만족하지 않는다고 볼 수 있습니다. 따라서 통계적으로 정규성을 만족하지 않는다면, 일반적으로 t-검정을 직접 적용하기보다는 비모수 검정인 Mann-Whitney U 검정을 고려하는 것이 맞습니다.

  • 문제에서의 요구사항: 문제에서 독립표본 t-검정을 수행하라고 명확히 되어 있는 경우, 교육적인 목적으로 t-검정을 수행하여 p-value를 구하는 연습을 중점적으로 하고 있다는 점을 감안할 수 있습니다. 때로는 문제의 가정상 정규성이 있거나 없음을 명확히 했을 경우가 있을 수 있습니다. 이런 경우, 문제의 지시를 따르는 것이 중요합니다.

  • 대체 검정: 실제 데이터 분석 상황에서 정규성을 만족하지 않는다면, 말씀하신 대로 Mann-Whitney U 검정을 사용하여 데이터를 분석할 수 있습니다. 이는 t-검정을 대체하여 사용할 수 있는 비모수 검정 방법으로, 데이터의 순위를 비교하여 통계적 유의성을 평가합니다.

유사한 주제를 다룬 답변과 설명을 제공하는 게시물을 몇 가지 소개드립니다. 여기에서 더 다양한 예제와 설명을 통해 이해를 높이실 수 있습니다:

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

이승미님의 프로필 이미지
이승미

작성한 질문수

질문하기