작업형3 범주형 데이터 분석


안녕하세요,
수업시간에 작업형3 독립성 검정(범주형 데이터 분석)에서 아래와 같은 방법들을 알려주셨는데요, 어디까지가 방법1이고 어디부터가 방법2인지 알 수 있을까요? 시험에서는 가장 쉬운 방법으로 하고 싶은데요, 독립성 검정에서 가장 간단하고 쉽게 코드를 작성하려면 어떻게 작성하면 되는건지 알려주시면 감사하겠습니다.
그리고 수업 노트에 빈칸으로 된 파일이 안 올라와 있던데, 올려주시면 감사하겠습니다.
답변 2
0
안녕하세요!
chi2_contingency 함수로 독립성 검정을 구할 수 있어요
따라서 chi2_contingency 함수까지를 기준으로 방법1과 2로 나눌 수 있는데
이부분 따로 표기해 줄게요:)
확인 부탁드립니다.
0
안녕하세요, 인프런 AI 인턴입니다.
wanyz101010님, 작업형3 범주형 데이터 분석에 대해 질문해 주셨네요.
말씀하신 코드에서는 방법1과 방법2의 구분이 주석이나 코드로 명확히 표시되어 있지는 않지만, 설명에 따라 보면 두 가지 방식의 데이터 프레임 정의 및 검정 수행이 사용된 것으로 보입니다.
방법1: 기존의 데이터 프레임을 사용하여 chi-square 테스트를 수행합니다. 주로 첫 번째 코드 셀의 경우 입니다.
방법2:df를[[80, 20], [90, 10]]형태로 다시 정의한 후 동일한 검정을 수행하는 두 번째 방법으로 보입니다.
시험에서 가장 간단하고 쉽게 작성하려면, 이미 잘 알고 계신 대로 scipy의 chi2_contingency 함수를 사용하시는 것이 좋습니다. 코드 예시는 다음과 같습니다.
import pandas as pd
from scipy import stats
# 데이터 프레임 생성
data = {'R': [80, 20], 'Python': [90, 10]}
df = pd.DataFrame(data, index=['Pass', 'Fail'])
# 독립성 검정 수행
chi2, p, dof, expected = stats.chi2_contingency(df)
print(f"Chi-square Statistic: {chi2}, p-value: {p}")
각 방법의 차이점을 이해하고 있어야 하므로, 직접 방식을 설정해서 해보시는 걸 추천드립니다.
노트에 빈칸으로 된 파일과 같은 학습 자료는 강의 페이지에서 확인해 보실 수 있고, 만약 올라와 있지 않다면 ‘문의하기’를 통해 인프런에 직접 요청해 보시는 것도 좋을 것 같습니다.
강의 자료 관련 링크: 강의자료 확인하기
도움이 되셨길 바랍니다! 추가적인 질문이 있으시면 언제든지 문의해 주세요.
뒤로가기 버튼 같은 것이 있나요?
0
28
1
강의 연장 문의
0
32
1
출력값 질문
0
31
2
수업노트가 어디에 있나요?
0
29
1
실기시험 제출관련
0
160
2
6.20 작업형 2 과적합
0
169
3
코딩팡 장업형2 베이스 라인 인코딩 종류 질문
0
54
2
로지스틱회귀, 회귀
0
52
2
회귀 문제를 풀때 질문입니다.
0
59
1
불균형 처리 후 성능이 더 낮아졌다면,
0
66
2
실기 체험 제2유형 에러 문의
0
66
1
LIGHTGBM 으로 하면 pred값이 소수점 6자리까지 나오는게 맞나요
0
52
2
3번문제 등분산 가정
0
50
2
작업형3 target 형 변환 질문
0
38
2
[작업형1] 연습문제 섹션1 ~ 10 의 section4
0
40
3
원핫인코딩과 레이블 인코딩에서 concat
0
62
2
제2유형 질문입니다.
0
49
2
C()
0
44
2
작업형 2에서 strafity 적용 유무
0
53
2
수강 기간 연장 가능 여부 문의드립니다.
0
63
1
ols
0
44
2
2유형 작성관련 질문(일반 심화)
0
41
2
2유형 작성관련 질문
0
42
2
2유형 object컬럼 개수 다르면
0
49
2





