인프런 커뮤니티 질문&답변

inflearn님의 프로필 이미지
inflearn

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

dir 함수 사용, logit

해결된 질문

작성

·

389

·

수정됨

0

  1. dir 함수를 사용해서

 

from statsmodels 뒤에 값들을 찾을 수 있나요?

해도 계속 오류가 나서요 ㅠㅠ

 

from statsmodels.formula.api import ols

 

ols 값을 import 하는 방법이 기억안날까봐 찾을 방법 있으면 알려주심 감사하겠습니다!!

 

 

  1. logit 모델 사용할 때

object 값 아닌 독립변수 전체를 C () 처리를 하니까 오류가 나던데 전체를 하면 안되는 건가요?

이전에 강의에서 전체를 해도 된다고 했던것 같아서요!!

답변 1

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

  1. statsmodels 만 찾을 때는

import statsmodels 또는 import statsmodels.api를 활용해야 합니다.

(커리큘럼 하단 - dir help 영상을 참고해주세요)

2

네 전체를 하면 안됩니다. C()는 범주형 변수에게만 씌우는 것이고 전체를 해도 된다는 것은 분산분석일 때 독립변수가 범주형이라서 그 말을 했습니다. 회귀나 로지스틱회귀에는 그렇게 적용하면 안됩니다.

(커리큘럼 하단 - 시험응시전략 영상을 참고해주세요)

수치형이면서 범주형인 값에 'C()' 함수를 사용하는 것은 해당 변수를 범주형으로 명시적으로 처리하도록 모델에게 지시하는 것입니다. 예를 들어, '1', '2', '3'과 같은 수치가 실제로는 '소형', '중형', '대형'과 같은 범주를 나타내는 경우에 해당합니다.

작업형2를 예를 들어 모델을 만들 때 범주형 변수가있다면 인코딩처리를 했었어요!

작업형3에서 사용하는 ols(회귀), logit(로지스틱회귀)는 범주형 변수가 있다면 자동으로 이를 (원핫인코딩)처리 해줍니다. 하지만 여전히 숫자일 인 범주형 변수 그러니깐 1등급, 2등급으로 작성된 것이 아니라 1, 2로 장성된 변수는 별도 범주형 변수로 인식시켜줘야 해요

이때 C()를 사용합니다.

분산분석에서는 독립변수가 범주형 변수이니 숫자만 C()로 묶어도 되고, 습관적으로 독립변수 모두를 각각 C()로 묶어도 됩니다.

 

inflearn님의 프로필 이미지
inflearn

작성한 질문수

질문하기