강의

멘토링

커뮤니티

인프런 커뮤니티 질문&답변

semistone6239님의 프로필 이미지
semistone6239

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

[작업형3] 4~5 분산 분석

[작업형3] 4~5 분산 분석

해결된 질문

작성

·

31

0

답안 풀이는 anova_lm을 불러올 때

import statsmodels.api as sm
from statsmodels.formula.api import ols

# 1~9 이원 분산 분석
model = ols('수확량 ~ C(비료유형) * C(물주기)', data=df).fit()
anova_table = sm.stats.anova_lm(model)
print(anova_table)

이런식으로 불러오는데

 

아래와 같이 import하면 결과가 다른데 문제가 있나요? 뭐가 맞을까요

from statsmodels.stats.anova import anova_lm

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

결과 차이가 있을 수 없는데 동일한 라이브러리 입니다. 혹시 캡쳐해서 보여주실 수 있을까요?

0

안녕하세요, 인프런 AI 인턴입니다.

semistone6239님의 질문은 anova_lm 함수의 import 방식에 따라 결과가 달라지는 것이 타당한지에 관한 것입니다. ANOVA(분산분석) 분석에서는 statsmodels 라이브러리의 두 모듈이 사용될 수 있습니다.

  1. import 방식의 차이: from statsmodels.stats.anova import anova_lmimport statsmodels.api as smsm.stats.anova_lm(...)로 함수 호출하는 방법 모두 anova_lm를 사용할 수 있는 방법입니다. 실제로 두 방식 모두 동일한 anova_lm 함수를 불러오며, 결과 차이가 발생하지 않습니다. 다만, 다른 점은 불러오는 경로와 사용법이 다르게 설정되는 정도입니다.

    • from statsmodels.stats.anova import anova_lm: 직접 anova_lm 함수를 가져오므로 추후 호출 시 단순히 anova_lm(model)로 사용할 수 있습니다.
    • import statsmodels.api as sm: sm.stats.anova_lm(model)로 함수 호출이 필요합니다.
  2. 결과 차이가 없을 것임: 두 스크립트 모두 같은 결과를 산출하여야 하며, Python 환경이나 statsmodels 버전에서의 이상이 아닌 이상 동일하게 작동할 것입니다. 만약 특정 환경에서 두 코드의 결과가 다르다면, 이는 코드 구조가 아닌 다른 요소 (예: 데이터 자체, 환경 설정 등)에서 원인을 찾는 것이 좋습니다.

결과적으로, 둘 다 사용 가능하며, 상황에 따라 본인이 선호하는 코드 스타일을 선택하시면 됩니다. 어떤 방식을 쓰더라도 이점이나 성능 차이는 발생하지 않습니다.

관련하여 자세한 분산분석 예제를 보고 싶다면, 다음 유사한 질문에 대한 답변도 참고해 보세요:

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

semistone6239님의 프로필 이미지
semistone6239

작성한 질문수

질문하기