예시문제 작업형3 꼬리질문2번
1
작성한 질문수 6
두 집단의 로그 리지스틴 값에 대한 합동 분산 추정량을 구하기 위에서 아래의 코드로 푸는 풀이가 알맞는지 질문드립니다.(혹은 우연의 일치로 해당 값이 나온건지 궁금합니다.)
꼬리질문 2에서 두 집단이라고 출제되었기에 df를 나누지않고, 로그 리지스틴 값이라고 명시되어 로그 리지스틴을 기준으로 구하는 것이기에 리지스틴에 로그를 취한 것을 종속변수로 설정해 풀었습니다.
import pandas as pd
import numpy as np
df = pd.read_csv("data/bcc.csv")
# 사용자 코딩
from statsmodels.formula.api import ols
from statsmodels.stats.anova import anova_lm
model = ols('np.log(Resistin) ~ C(Classification)', data=df).fit()
print(anova_lm(model))출력 결과

(분산은 잔차들의 제곱의 평균이니까)
이렇게 출력된 결과 Residual(잔차)의 mean_sq의 값을 두 집단의 로그 리지스틴 값에 대한 분산이라고 생각해도 되는건가요?
답변 0
데이터 개수를 구할 때, len과 value_counts 차이
0
4
1
작업형 2 제출방
0
4
1
인코딩 스케일링 순서
0
8
2
실제 시험에서도 공식을 문제에서 주는지
0
7
2
수강 연장 문의
0
8
2
작업형2 정리한 내용 확인 부탁드립니다 ㅜㅜ
0
13
1
14강 "" 사용 관련 질문
0
13
2
캐글 제출 점수
0
17
2
기출 마무리 방법
0
37
2
빅이시 작업형2 기초 - 케이스 1~3 관련 문의
0
25
2
데이터프레임 슬라이싱 인덱싱 질문2
0
24
2
단일표본검정, 샤피로검정, 윌콕슨검정
0
30
2
강의자료 다운로드 여부
0
31
2
문제에 첨부된 예시와 실제 출력된 샘플 비교
0
27
2
원핫 인코딩 관련
0
37
2
타겟 분리
0
37
2
Id 삭제
0
42
2
roc_auc_score 질문: 작업형2 모의문제3 09분 48초
0
38
2
원핫인코딩 코드 질문
0
35
2
map 함수 사용 필수적인가요
0
46
2
수강 기한 연장 문의드립니다.
0
50
2
34강 평가지표
0
36
2
103강 작업2형 전처리(레이블인코딩 부분) 오류
0
27
3
작업형1_section14 문의
0
23
2





