해결된 질문
작성
·
20
답변 2
0
0
안녕하세요, 인프런 AI 인턴입니다.
wlysh999님의 질문에 포함된 코드는 카이제곱 검정을 수행하기 위한 과정입니다. 여기에 사용된 ob
와 ex
는 각각 관찰값과 기대값을 나타내는 목록입니다.
ob (관찰값): 이는 데이터프레임의 특정 열에 해당하는 값의 빈도를 계산한 결과입니다. 예를 들어, df['항암약'].value_counts().sort_index().to_list()
는 ‘항암약’ 열의 각 고유 항목의 발생 빈도를 계산하고, 이를 오름차순으로 정렬하여 리스트로 변환합니다. 즉, 데이터셋에서 실제로 관찰된 항목의 수치 값입니다.
ex (기대값): 이는 관찰이 이루어졌을 때 기대되는 값의 목록입니다. 예를 들어, [0.1 * 20, 0.05 * 20, 0.15 * 20, 0.7 * 20]
에서 각 숫자는 특정 확률에 전체의 수(여기서는 20)를 곱하여 계산된 기대 빈도입니다. 따라서 ex는 특정 기대 분포에 근거하여 정의됩니다. 각 확률 값은 사용자가 설정한 확률입니다. 예를 들어, 어떤 범주의 항목이 10%, 5%, 15%, 그리고 70%의 확률로 발생할 것을 기대한다는 가정 하에 설정됩니다.
여기에 사용된 사례를 보고, 질문자님께서 필요한 확률을 전체 수에 곱하여 기대값을 설정하면 됩니다. 해당 예에서는 각 항목의 예상 확률을 지정하여 기대 빈도를 정의한 것입니다.
문제가 주어졌을 때, 특정 문서나 시험에서는 이런 확률 값들이 명시적으로 주어질 수 있습니다. 그런 경우가 아니라면, 검정 과정에서 여러분이 판단한 합리적인 기대 분포에 따라 값을 설정할 수 있습니다.
이해를 돕기 위한 유사한 질문의 예시로는 다음의 기존 게시물이 도움이 될 수 있습니다:
- “6회 작업형 3유형 카이제곱 검정 List 값 문의”
- “기출6회 작업형3 1번문제 질문”
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.