inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

이원 분산 분석

C( ) 를 묶는 이유

해결된 질문

419

성한

작성한 질문수 18

0

종자는 문자데이터에 잘 매칭되어있지만, 비료는 범주형임에도 불구하고 현재 수치형 11 ..로 배치되어 있기 때문에 비료에만 C ( )를 붙여준다고 설명해주셨습니다.

그러나 궁금한것은 "예시문제 작업형3(신 버전)" 타이타닉 로지스틱변환 문제에서 Gender가 male, female 인 object 데이터로 되어있으니 이를 수치형으로 바꾸신다고 C(Gender)를 해주셨는데요 그래서 제가 이번 이원분산분석 모델 만들때 비료에 C( )를 붙이지 않고 종자에만 C( )를 붙여보았습니다. 왜냐하면 비료와 토마토수 데이터들이 모두 수치형 데이터들이라 범주형 데이터인 종자 데이터들을 수치형으로 바꿔야 겠다고 생각했기 때문입니다.

 

그러나 C( )를 종자에 붙여서 model.summary 한 경우와 C ( )를 비료에 붙여서 model.summary한 경우의 계수나 p값 등이 다르더군요

질문1: 예시문제 작업형3(신 버전)에선 object형인 Gender에 C( )를 붙이시고, 이원분산분석에서는 object인 종자에 C( )를 안붙이신 이유가 궁금합니다

 

이원분산분석.JPGmodel1.JPGmodel2.JPG

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 1

0

퇴근후딴짓

이원 분산 분석 영상을 계속 보시면 처음에 붙이지 않고 보여드린 뒤
뒤에 종자와 비료 모두 C()를 모두 넣고 비교하고 있습니다.

정확하게는 카테고리 자료형에 붙이고 있습니다.

0

성한

그렇다면 비료에 C( )를 안붙이고 종자에만C( )를 붙여 수치로 인코딩하여 다시 결과를 내어도되는건가요?

0

퇴근후딴짓

개념을 다시 정리해드리겠습니다.

숫자이지만 범주형 데이터(비료)가 있고

문자인 범주형 데이터(종자)가 있습니다.

C()는 원핫 인코딩입니다. 비료와 종자는 범주형 데이터로 둘 다 원핫 인코딩을 해줘야 합니다.

출력값 질문

0

11

1

수업노트가 어디에 있나요?

0

21

1

실기시험 제출관련

0

153

2

6.20 작업형 2 과적합

0

158

3

코딩팡 장업형2 베이스 라인 인코딩 종류 질문

0

49

2

로지스틱회귀, 회귀

0

48

2

회귀 문제를 풀때 질문입니다.

0

55

1

불균형 처리 후 성능이 더 낮아졌다면,

0

61

2

실기 체험 제2유형 에러 문의

0

61

1

LIGHTGBM 으로 하면 pred값이 소수점 6자리까지 나오는게 맞나요

0

50

2

3번문제 등분산 가정

0

48

2

작업형3 target 형 변환 질문

0

35

2

[작업형1] 연습문제 섹션1 ~ 10 의 section4

0

36

3

원핫인코딩과 레이블 인코딩에서 concat

0

59

2

제2유형 질문입니다.

0

46

2

C()

0

44

2

작업형 2에서 strafity 적용 유무

0

52

2

수강 기간 연장 가능 여부 문의드립니다.

0

61

1

ols

0

43

2

2유형 작성관련 질문(일반 심화)

0

39

2

2유형 작성관련 질문

0

41

2

2유형 object컬럼 개수 다르면

0

48

2

코딩팡질문이요ㅠㅠ

0

45

2

관찰값과 기대값의 개념이 헷갈립니다.

0

25

2