inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

다중선형회귀2 (범주형 변수)

로지스틱 회귀 강의에서 변수형 변수는 c()처리를 했는데

해결된 질문

72

bonanza9312

작성한 질문수 8

0

로지스틱 회귀 강의에서 변수형 변수는 c()처리를 했는데 여기서는 별도 처리를 안하는건가요?

c()의 의미가 어떻게될까요?

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 2

0

퇴근후딴짓

문제에서 "이 변수는 범주형이다"라고 명시하지 않는 한, 임의로 c() 처리를 하면 안 됩니다!

작업형3이 정답이 있는 문제라 결과가 달라져요!

예를 들어 등급이 1,2,3만있어 이건 숫자이지만 범주형인데?라고 임의 판단하고 C()처리하면 안돼요!

 

C()는 범주형으로 처리하기 위함입니다. 문자는 로지스틱회귀가 자체적으로 자동으로 처리되지만 숫자인 경우 C()로 묶어줘야 처리됩니다

0

인프런 AI 인턴

안녕하세요, 인프런 AI 인턴입니다. bonanza9312님.

로지스틱 회귀에서 C() 처리를 하셨다는 부분에 대해 궁금하신 점이 있으시군요. C() 함수는 Python의 statsmodels 라이브러리에서 범주형 변수를 명시적으로 처리할 때 사용합니다. 특정 변수가 수치형으로 나타나지만 사실은 범주형일 경우(예: 사용자 등급이 소형, 중형, 대형으로 구분될 때, 수치 ‘1’, ‘2’, ‘3’으로 입력된 경우 등), 이 변수를 범주형으로 처리하도록 C()를 사용합니다.

로지스틱 회귀에서는 독립변수 중 수치형으로 입력되었지만 논리적으로 범주형인 변수를 C()로 감싸서 명확히 범주형 변수임을 모델에 알려주게 됩니다. 이렇게 하면 모델이 해당 변수를 더 잘 해석할 수 있습니다.

관련하여 이미 유사한 질문이 있으니 참고하시면 더 도움이 되실 것 같습니다:

이해가 잘 되셨길 바라며, 추가적으로 궁금한 점이 있으시면 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

11회 기출 유형(작업형1) 2번 정답

0

8

1

f1 score 질문

0

8

1

10회 작업형 2 인코딩 질의

0

8

1

53번 강의에서 갑자기 수업노트가 없어졌습니다.

0

15

2

28:19 roc_auc이유

0

16

2

수강연장문의

0

17

2

전체적인 머신러닝 순서

0

13

1

빅분기 실기 유형2질문

0

17

1

ID 전처리 이유

0

29

2

데이터제공

0

25

2

예시문제 작업형3 꼬리질문2번

0

16

1

데이터 개수를 구할 때, len과 value_counts 차이

0

20

2

작업형 2 제출방

0

19

2

인코딩 스케일링 순서

0

20

2

실제 시험에서도 공식을 문제에서 주는지

0

20

2

수강 연장 문의

0

17

2

작업형2 정리한 내용 확인 부탁드립니다 ㅜㅜ

0

22

1

14강 "" 사용 관련 질문

0

22

2

캐글 제출 점수

0

26

2

기출 마무리 방법

0

51

2

빅이시 작업형2 기초 - 케이스 1~3 관련 문의

0

33

6

데이터프레임 슬라이싱 인덱싱 질문2

0

29

2

단일표본검정, 샤피로검정, 윌콕슨검정

0

39

2

강의자료 다운로드 여부

0

39

2