강의

멘토링

로드맵

Inflearn brand logo image

인프런 커뮤니티 질문&답변

지원님의 프로필 이미지
지원

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

단일표본검정

가설검정(빈칸) 풀이답

해결된 질문

작성

·

57

0

from scipy import stats
stats.wilcoxon(df['after'],df['before'],alternative='greater')

안녕하세요~ 가설점정 강의자료중에 빈칸으로 공부를 하다가 질문남깁니다.

 

빈칸자료로 풀었을때 답이

/usr/local/lib/python3.11/dist-packages/scipy/stats/_wilcoxon.py:172: RuntimeWarning: invalid value encountered in scalar divide z = (r_plus - mn) / se

WilcoxonResult(statistic=np.float64(0.0), pvalue=np.float64(1.0))

 

이맇게 나오는데요~ 강의자료랑 답도 다르고 ..왜 그런가요?ㅜ

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

에러가 안나는데 혹시 다시해도 그럴까요?

코랩 재실행 후 확인 부탁드릴게요!

0

안녕하세요, 인프런 AI 인턴입니다.

지원님께서 Wilcoxon 검정 관련하여 발생한 문제에 대해 질문해주셨네요. 말씀하신 코드와 결과를 보게 되면, scipy.stats.wilcoxon 함수에서 RuntimeWarning이 발생하면서 예상치 못한 결과가 나오는 상황이군요. 이는 데이터의 분포나 입력값의 조건이 맞지 않을 때 발생할 수 있습니다.

  1. 데이터 확인: 먼저, df[‘after’], df[‘before’] 데이터가 실제로 비교 가능한지, 결측치가 없는지 확인해 보세요. 데이터 값이 모두 동일하거나, 어떤 특별한 경우에 따라 NaN이나 inf가 포함되어 있을 수 있습니다.

  2. Wilcoxon 검정의 조건: Wilcoxon 검정은 두 집단의 차이가 non-parametric한지 검정하는 방법입니다. 입력값은 서로 독립적이어야 하며, 차이가 정규분포를 따르지 않아야 할 때 주로 사용됩니다. 따라서 데이터의 차이값이 0이거나 매우 작을 경우 RuntimeWarning이 발생할 수 있습니다.

  3. 사이즈 문제: 또한, 두 데이터 시리즈 사이의 크기가 동일한지 확인해 보세요. 크기가 다르다면 결과에 영향을 줄 수 있습니다.

관련하여 아래 링크를 참고하시면 도움이 될 수 있습니다:

  • Wilcoxon 검정 관련 질문: 유사한 주제의 질문이 다루어지는 곳으로, Wilcoxon 검정을 수행하는 데 일반적으로 발생하는 문제에 대한 해결책을 확인하실 수 있습니다.

이러한 사항들을 검토해보시면 문제가 해결될 가능성이 높습니다. 그래도 해결되지 않는다면, 데이터 샘플이나 세부적인 상황을 추가적으로 확인해 보아야 할 것 같습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

지원님의 프로필 이미지
지원

작성한 질문수

질문하기