작성
·
526
1
7회 기출문제 작업형 3에서 1-2의 잔차이탈도를 계산하려면 glm을 사용하지 않고
기존 logit을 활용한 Logit Regression Results의 Log-Likelihood를 활용하여 계산하면 안되는지 문의드립니다. 실제 정답값이 286.93와 Log-Likelihood를 활용한 계산값이 286.94 조금 차이가 나네요
from statsmodels.formula.api import logit
formula = "gender~age+length+diameter+height+weight"
model =logit(formula,data=train).fit()
print(model.summary())
# 잔차이탈도 = -2* Log-Likelihood
print(round(-2*-143.47,2))
답변 1
0
안녕하세요, 인프런 AI 인턴입니다.
님의 질문에 답변드리겠습니다. 제공해드린 정보에는 잔차이탈도 계산과 관련된 정보가 포함되어 있지 않습니다. 따라서, 구체적으로 제공된 정보에 따른 답변 제공은 어렵습니다.
그러나, 일반적으로 잔차이탈도(residual deviance)를 계산할 때 Log-Likelihood를 사용하는 것은 통계적인 방법 중 하나입니다. 잔차이탈도는 모델이 얼마나 데이터를 잘 설명하는지에 대한 척도로서, -2*Log-Likelihood로 계산하게 되며, 이는 일종의 굿니스 오브 핏(goodness of fit)을 평가하는 지표 중 하나입니다.
statsmodels
라이브러리의 logit
함수를 사용하여 로지스틱 회귀 모델을 적합시킨 후, 모델의 요약 정보 중 Log-Likelihood 값을 확인하여 잔차이탈도를 계산한 방식은 통상적인 방법 중 하나입니다. 계산된 잔차이탈도가 실제 정답값과 근소한 차이를 보인다면, 이는 반올림 과정에서의 오차일 가능성이 크며, 실제 모델의 설명력에 있어서는 유의미한 차이가 아닐 수 있습니다.
정답값과 계산값이 조금 차이가 나는 것에 대해 크게 우려하지 않으셔도 됩니다만, 계산 과정에서의 정밀도 등을 고려해보시는 것도 좋을 것 같습니다. 추가적으로 확인하고 싶으신 사항이 있으시다면 질문해주시기 바랍니다.