inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

회귀분석, 분산분석 범주형 변수

해결된 질문

260

이명주

작성한 질문수 15

0

선생님 안녕하세요, 3유형 공부하다가 궁금한 점이 있어서 질문남깁니다.

선형회귀분석에서 독립변수가 범주형일 경우에 원핫인코딩 처리를 안하고, C( )처리를 안해도 자동으로 인코딩이 되는건가요??

반면에 anova에서는 꼭 C ( )를 붙여야 범주화변수 처리가 되나요???

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 1

0

퇴근후딴짓

문자로 되어 있는 경우 붙이지 않아도 되지만

범주형인데 숫자로 되어 있다면 붙여 줘야 합니다. 🙂

0

이명주

앗 그럼 범주형인데 숫자로 되어 있는 경우에 C 붙이는 것이 선형회귀, 로지스틱회귀, 분산분석에 모두 해당하는건가요!!?

숫자로 되어 있는데 범주형인지, 수치형인지 구분이 불가능할 경우에 모두 C를 붙여도 무방한가요!?ㅜㅠㅠㅠ

0

퇴근후딴짓

아니요! 모두 붙이면 안됩니다.
회귀 분석에서 모두 붙여 버리면 에러가 나거나 이상한 결과가 도출됩니다.

숫자인데 범주형이라면 문제에서 명시하거나 상식적으로 누구나 알만한 변수 일 것으로 예상됩니다.

0

이명주

선생님 그러면 회귀분석과 분산분석 모두 문자로 된 범주형 변수는 자동으로 인코딩이 되고, 숫자로 되어 있는 범주형만 C로 묶어주는 걸로 이해하면 될까요!!?

0

퇴근후딴짓

네 맞습니다.

작업형2 모의문제1 (30강)

0

18

1

수강 기간 연장 문의 드립니다.

0

21

1

수강 계획과 관련해 문의 드립니다.

0

19

1

작업형1 - 연습문제 16~39 풀이는 몇강을 보면 되나요?

0

44

2

작업형 1 -연습문제 4-6

0

32

2

작업형 1 유형 부분

0

40

2

작업형 1 (삭제예정, 구 버전)

0

50

2

수강기간 연장 문의드립니다.

0

35

1

2유형 레이블 인코딩 VS 원핫 인코딩

0

36

3

수강기간 연장 문의드립니다.

0

38

1

인덱스 슬라이싱

0

35

2

질문 드립니다.

0

49

2

강의 내용 관련 질문드립니다~

0

46

2

수강 연장 문의

0

63

2

강의자료 일괄 다운로드

0

58

2

수강기간 연장 문의드립니다

0

47

2

list 문제 질문드립니다~

0

38

2

빅분기 실기 12회 재도전

0

62

2

강의 기간 연장 가능여부 검토 요청건

0

49

2

수강기간 연장 문의 드립니다

0

45

2

수강기간 연장 문의드립니다

0

52

2

질문이요

0

57

2

수강기간 연장 문의드립니다.

0

60

2

문제 3-2 질문드립니다

0

47

2