강의

멘토링

로드맵

Inflearn brand logo image

인프런 커뮤니티 질문&답변

wlysh999님의 프로필 이미지
wlysh999

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

6회 기출유형 (작업형3)

기출6회 제3유형

해결된 질문

작성

·

20

0

 

기출6회 제3유형 해설을보면

아래 ob / ex을 어디서 구하는건가요?

 

ob는 어떻게 구하면 될 것같은데

ex는 제가 알아서 임의로 작성하면 되는건지 문의드립니다.

ob = df['항암약'].value_counts().sort_index().to_list()
ex = [0.1 * 20, 0.05 * 20, 0.15 * 20, 0.7 * 20]

from scipy import stats
stats.chisquare(ob, ex)

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

기대값은 임의가 아니에요:)

확률이 있고 전체 인원은 20명입니다.

계산된 기대 빈도입니다.

0

안녕하세요, 인프런 AI 인턴입니다.

wlysh999님의 질문에 포함된 코드는 카이제곱 검정을 수행하기 위한 과정입니다. 여기에 사용된 obex는 각각 관찰값과 기대값을 나타내는 목록입니다.

  • ob (관찰값): 이는 데이터프레임의 특정 열에 해당하는 값의 빈도를 계산한 결과입니다. 예를 들어, df['항암약'].value_counts().sort_index().to_list()는 ‘항암약’ 열의 각 고유 항목의 발생 빈도를 계산하고, 이를 오름차순으로 정렬하여 리스트로 변환합니다. 즉, 데이터셋에서 실제로 관찰된 항목의 수치 값입니다.

  • ex (기대값): 이는 관찰이 이루어졌을 때 기대되는 값의 목록입니다. 예를 들어, [0.1 * 20, 0.05 * 20, 0.15 * 20, 0.7 * 20]에서 각 숫자는 특정 확률에 전체의 수(여기서는 20)를 곱하여 계산된 기대 빈도입니다. 따라서 ex는 특정 기대 분포에 근거하여 정의됩니다. 각 확률 값은 사용자가 설정한 확률입니다. 예를 들어, 어떤 범주의 항목이 10%, 5%, 15%, 그리고 70%의 확률로 발생할 것을 기대한다는 가정 하에 설정됩니다.

여기에 사용된 사례를 보고, 질문자님께서 필요한 확률을 전체 수에 곱하여 기대값을 설정하면 됩니다. 해당 예에서는 각 항목의 예상 확률을 지정하여 기대 빈도를 정의한 것입니다.

문제가 주어졌을 때, 특정 문서나 시험에서는 이런 확률 값들이 명시적으로 주어질 수 있습니다. 그런 경우가 아니라면, 검정 과정에서 여러분이 판단한 합리적인 기대 분포에 따라 값을 설정할 수 있습니다.

이해를 돕기 위한 유사한 질문의 예시로는 다음의 기존 게시물이 도움이 될 수 있습니다:
- “6회 작업형 3유형 카이제곱 검정 List 값 문의”
- “기출6회 작업형3 1번문제 질문”

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

wlysh999님의 프로필 이미지
wlysh999

작성한 질문수

질문하기