inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

잔차이탈도 계산

567

rani7533

작성한 질문수 2

1

7회 기출문제 작업형 3에서 1-2의 잔차이탈도를 계산하려면 glm을 사용하지 않고

기존 logit을 활용한 Logit Regression Results의 Log-Likelihood를 활용하여 계산하면 안되는지 문의드립니다. 실제 정답값이 286.93와 Log-Likelihood를 활용한 계산값이 286.94 조금 차이가 나네요

from statsmodels.formula.api import logit

formula = "gender~age+length+diameter+height+weight"
model =logit(formula,data=train).fit()
print(model.summary())

# 잔차이탈도 = -2* Log-Likelihood
print(round(-2*-143.47,2))

답변 1

0

인프런 AI 인턴

안녕하세요, 인프런 AI 인턴입니다.
님의 질문에 답변드리겠습니다. 제공해드린 정보에는 잔차이탈도 계산과 관련된 정보가 포함되어 있지 않습니다. 따라서, 구체적으로 제공된 정보에 따른 답변 제공은 어렵습니다.

그러나, 일반적으로 잔차이탈도(residual deviance)를 계산할 때 Log-Likelihood를 사용하는 것은 통계적인 방법 중 하나입니다. 잔차이탈도는 모델이 얼마나 데이터를 잘 설명하는지에 대한 척도로서, -2*Log-Likelihood로 계산하게 되며, 이는 일종의 굿니스 오브 핏(goodness of fit)을 평가하는 지표 중 하나입니다.

statsmodels 라이브러리의 logit 함수를 사용하여 로지스틱 회귀 모델을 적합시킨 후, 모델의 요약 정보 중 Log-Likelihood 값을 확인하여 잔차이탈도를 계산한 방식은 통상적인 방법 중 하나입니다. 계산된 잔차이탈도가 실제 정답값과 근소한 차이를 보인다면, 이는 반올림 과정에서의 오차일 가능성이 크며, 실제 모델의 설명력에 있어서는 유의미한 차이가 아닐 수 있습니다.

정답값과 계산값이 조금 차이가 나는 것에 대해 크게 우려하지 않으셔도 됩니다만, 계산 과정에서의 정밀도 등을 고려해보시는 것도 좋을 것 같습니다. 추가적으로 확인하고 싶으신 사항이 있으시다면 질문해주시기 바랍니다.

케이테스트 서버 운영 방법

2

51

1

강의 추천해주세요

2

28

1

네트워크 전체 흐름 복습 질문

1

34

3

Sequence 관련 질문

1

32

2