예시문제 작업형3 꼬리질문2번

Question

두 집단의 로그 리지스틴 값에 대한 합동 분산 추정량을 구하기 위에서 아래의 코드로 푸는 풀이가 알맞는지 질문드립니다.(혹은 우연의 일치로 해당 값이 나온건지 궁금합니다.) 꼬리질문 2에서 두 집단이라고 출제되었기에 df를 나누지않고, 로그 리지스틴 값이라고 명시되어 로그 리지스틴을 기준으로 구하는 것이기에 리지스틴에 로그를 취한 것을 종속변수로 설정해 풀었습니다. import pandas as pd import numpy as np df = pd.read_csv("data/bcc.csv") # 사용자 코딩 from statsmodels.formula.api import ols from statsmodels.stats.anova import anova_lm model = ols('np.log(Resistin) ~ C(Classification)', data=df).fit() print(anova_lm(model)) 출력 결과 (분산은 잔차들의 제곱의 평균이니까) 이렇게 출력된 결과 Residual(잔차)의 mean_sq의 값을 두 집단의 로그 리지스틴 값에 대한 분산이라고 생각해도 되는건가요?

퇴근후딴짓 · Answer

와!! 제가 한 수 배웠습니다. 👍👍👍👍👍👍 감사합니다. 저보다 더 쉽게 풀이 하셨네요!! 우연이 아니라 똑같습니다!