• 카테고리

    질문 & 답변
  • 세부 분야

    자격증 (데이터 사이언스)

  • 해결 여부

    해결됨

7회 작업형3-1 질문

24.05.05 20:53 작성 조회수 91

0

3-1번을 강의와는 다르게 다음과 같이 작성해봤습니다....

답이 다르게 나오던데.. 혹시 어떤 부분이 잘못되었는지 알려주실 수 있나여???

※ x_train에는 gender 컬럼 제외시켰고, y_train은 gender컬럼만 입니다.

 import statsmodels.api as sm
 x_train = sm.add_constant(x_train)
 model = sm.Logit(y_train, x_train).fit()
 print(round(np.exp(model.params['weight']),4))

답변 1

답변을 작성해보세요.

0

logit()은 상수항을 자동으로 추가하고
질문주신 Logit은 상수항을 수동으로 추가해야 합니다. 수동으로 처리할 때 그 처리 방식이 약간의 차이가 있을 수 있어요!
일반적인 상황에서는 큰 문제가 있는 차이가 아니지만 정답이 있는 시험에서는 이럴 경우 논란이 있을 것 같네요!
결론적으로 Logit방식은 틀린것은 아니나 빅분기에서는 추천하지는 않습니다.


그 근거로
제가 만든 문제는 R과 비교를 모두 하고 있어요!
시험에서는 R과 파이썬이 같은 결과가 나와야 합니다.

R에서도 1.0047이 나옵니다.
image