작업형 3, chisquare
1-2. 감기약의 예상 부작용 비율과 항암약의 부작용 관찰값이 통계적으로 유의미하게 차이가 있는지 확인하려 한다. 카이 제곱 검정을 사용하여 검정 통계량을 구하시오.
의 문제에서..
풀이를 비율로 했더니..
실제 풀이에서 ex = [0.1 * 20, 0.05 * 20, 0.15 * 20, 0.7 * 20]이렇게 원래 명 수로 계산한 것와 검정통계량p값이 다 달라지네요...
문제에서는 사실 어떤방식으로 명시하진 않았지만,
일반적으로 명수로 풀이를 해야하는걸까요?
답변 2
0
안녕하세요, 인프런 AI 인턴입니다.
cpfk1004님께서 질문하신 카이제곱 검정을 통한 검정 통계량 구하기와 관련된 부분에 대해 설명드리겠습니다.
카이제곱 검정에서 ex (기대값)은 관찰된 빈도와 비교하는데, 일반적으로 실제 데이터의 수(명수)로 계산하는 것이 일반적입니다. 이는 관찰된 빈도와 기대 빈도를 같은 단위, 즉 절대 수치로 비교해야 통계적으로 의미 있는 결과를 얻을 수 있기 때문입니다.
비율을 사용하여 카이제곱 검정을 수행할 경우, 기대 빈도와 관찰 빈도 모두 비율로 계산되어야특하지만, 대부분의 경우 비율이 아닌 실제 명수로 처리하는 것이 일반적입니다. 이는 결과의 해석에서 예상치 못한 오류를 방지하기 위한 것입니다.
이와 관련해 유사한 질문과 답변이 있었으며, 같은 관점을 공유하고 있습니다:
- 기출6회 작업형3 1번문제 질문에서는 관찰값과 기대값을 명수로 계산하여
stats.chisquare를 사용하는 것이 더 올바르다는 설명이 있었습니다. 해당 방법이 오류를 방지하고 검정 통계량의 신뢰성을 확보하는데 효과적입니다.
위 링크에서 자세한 예제와 설명을 확인하실 수 있으며, 이 방법을 따르면 검정 통계량과 p-값의 일관성을 유지할 수 있습니다. 실제 값과 기대 값을 같은 단위로 통일하여 적용하세요.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.
작업형2 카테고리
0
4
1
110강 회귀_8번 문의
0
8
2
XGBRegressor 학습 시 warning 출력
0
11
2
데이터 프레임을 변경해도 되나요?
0
9
2
10회 기출 작업형3 문제 2-1 질문
0
14
2
작업형 2 질문
0
13
2
작업형 2 템플릿 확인 요청
0
12
2
작업형2 인코딩 질문
0
22
2
작업형 3 벼락치기 공부방법 질문
0
30
2
기출 11회 작업형 2_전체 데이터 학습 여부
0
31
2
예측값 결과 소수점 차이
0
26
2
기출 문제와 실전챌린지 연습문제 무엇부터 푸는게 나은가요?
0
34
1
전처리 train() test([ ])
0
23
2
작업형 1 배경지식 질문
0
31
2
옳게 풀은건지 질문드립니다!
0
21
1
roc_auc_score
0
29
2
추가질문 합니다
0
22
2
시험환경 구름
0
19
2
2유형 질문드려요
0
20
2
RandomForest vs lgb
0
27
2
전처리 관련질문
0
29
3
작업형3 기출
0
19
2
유형2에서 데이터분할 생략 가능여부
0
32
2
9회 기출 유형3 질문
0
21
2





