inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

캐글 개 나이 예측 문항

해결된 질문

129

익명

작성한 질문수 2

0

안녕하세요!

작업형 2번 관련해서 질문 드려도 괜찮을까요…?

혹시 get dummies 하기 전에 데이터 합치고 나눠야만 하나요..?

수치형 데이터로 구성되어있고, 컬럼 같을 경우에는 합치고 나누는 작업 없이 get dummies 진행했는데 다른 풀이하고 결과값이 조금 차이 나는 것 같아서요!

Get dummies 전후로 데이터 합치고 나누는 이유를 알고 싶습니다!

제 코드

# print(train.shape, test.shape)

train = pd.get_dummies(train)

test = pd.get_dummies(test)

# print(train.shape, test.shape)

다른 분들 모범 코드입니다¡

data = pd.concat([train,test])

data = pd.get_dummies(data)

train = data.iloc[:len(train)]

test = data.iloc[len(train):]

 

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 1

0

퇴근후딴짓

아마도 카테고리가 다를 경우를 대비해 합쳐서 인코딩하는 것으로 무조건 준비하는 분들이 계세요~

그 경우인 것 같습니다 🙂

꿀팁 "인코딩 할 때 에러가 난다면?" 영상참고

질문 드립니다.

0

38

2

강의 내용 관련 질문드립니다~

0

34

2

수강 연장 문의

0

33

1

강의자료 일괄 다운로드

0

42

2

수강기간 연장 문의드립니다

0

28

1

list 문제 질문드립니다~

0

30

2

빅분기 실기 12회 재도전

0

40

1

강의 기간 연장 가능여부 검토 요청건

0

30

1

수강기간 연장 문의 드립니다

0

36

2

수강기간 연장 문의드립니다

0

47

2

질문이요

0

51

2

수강기간 연장 문의드립니다.

0

50

2

문제 3-2 질문드립니다

0

44

2

수강기간 연장 문의 드립니다.

0

58

2

변수, 칼럼 , df 구분

0

50

2

수강기간 연장 문의드립니다.

0

50

2

수강기간 연장 문의

0

48

2

수강기간 연장 문의드립니다.

0

42

2

수강기한 연장 문의

0

79

2

수강기간 연장 문의드립니다

0

57

2

결정트리에서 적절한 깊이 선택 후 시각화 과정에서 학습 데이터만 사용하는 이유

0

45

2

수강기간 연장 문의드립니다.

0

71

2

수강연장 문의

0

77

2

수강연장문의

0

53

2