해결된 질문
작성
·
57
0
from scipy import stats
stats.wilcoxon(df['after'],df['before'],alternative='greater')
안녕하세요~ 가설점정 강의자료중에 빈칸으로 공부를 하다가 질문남깁니다.
빈칸자료로 풀었을때 답이
/usr/local/lib/python3.11/dist-packages/scipy/stats/_wilcoxon.py:172: RuntimeWarning: invalid value encountered in scalar divide z = (r_plus - mn) / se
WilcoxonResult(statistic=np.float64(0.0), pvalue=np.float64(1.0))
이맇게 나오는데요~ 강의자료랑 답도 다르고 ..왜 그런가요?ㅜ
답변 2
0
0
안녕하세요, 인프런 AI 인턴입니다.
지원님께서 Wilcoxon 검정 관련하여 발생한 문제에 대해 질문해주셨네요. 말씀하신 코드와 결과를 보게 되면, scipy.stats.wilcoxon
함수에서 RuntimeWarning
이 발생하면서 예상치 못한 결과가 나오는 상황이군요. 이는 데이터의 분포나 입력값의 조건이 맞지 않을 때 발생할 수 있습니다.
데이터 확인: 먼저, df[‘after’], df[‘before’] 데이터가 실제로 비교 가능한지, 결측치가 없는지 확인해 보세요. 데이터 값이 모두 동일하거나, 어떤 특별한 경우에 따라 NaN이나 inf가 포함되어 있을 수 있습니다.
Wilcoxon 검정의 조건: Wilcoxon 검정은 두 집단의 차이가 non-parametric한지 검정하는 방법입니다. 입력값은 서로 독립적이어야 하며, 차이가 정규분포를 따르지 않아야 할 때 주로 사용됩니다. 따라서 데이터의 차이값이 0이거나 매우 작을 경우 RuntimeWarning이 발생할 수 있습니다.
사이즈 문제: 또한, 두 데이터 시리즈 사이의 크기가 동일한지 확인해 보세요. 크기가 다르다면 결과에 영향을 줄 수 있습니다.
관련하여 아래 링크를 참고하시면 도움이 될 수 있습니다:
이러한 사항들을 검토해보시면 문제가 해결될 가능성이 높습니다. 그래도 해결되지 않는다면, 데이터 샘플이나 세부적인 상황을 추가적으로 확인해 보아야 할 것 같습니다.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.