inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

작업형 2번 라벨인코딩 질문

해결된 질문

388

빅분초보

작성한 질문수 10

0

실기 2회의 작업형 2번에서
X_train, y_train, X_test로 데이터가 구성 되어 있는데

X_train의 데이터를 라벨인코딩 하려고 하니깐

y should be a 1d array, got an array of shape (8799, 4) instead.

이런 내용의 에러 메세지가 떴습니다. 모델의 타겟 변수인 'y'가 2차원 배열이 아닌 1차원 배열이어야 한다는 내용입니다.

 

# 라벨인코딩 제가 작성한 코드입니다.

cols = ['Warehouse_block', 'Mode_of_Shipment', 'Product_importance', 'Gender']

from sklearn.preprocessing import LabelEncoder

le=LabelEncoder()

X_train[cols] =le.fit_transform(X_train[cols])

X_test[cols] = le.transform(X_test[cols])

 

질문1

X_train, y_train, X_test로 데이터가 구성 되어있으면 무조건

X_train, y_trian을 합쳐서 라벨인코딩을 해야하나요?
질문2

합치지 않고도 쉽게 할 수 있는 방법이 있나요?

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 1

0

퇴근후딴짓

  1. X_train, y_trian을 합쳐 인코딩을 진행할 필요가 없습니다.

     

     

     


    단, X_train과 X_test(또는 test)를 합쳐서 인코딩하는 것을 이야기 하는 것이라면 이부분은

     

     

    train에는 사과 딸기 배 가 있고

     

    test에는 딸기 포도

와 같이 종류가 다를 때를 말합니다. 그리고 2~6회까지 아직 이런 케이스는 없었습니다.

작업형2 모의문제1 (30강)

0

18

1

수강 기간 연장 문의 드립니다.

0

22

1

수강 계획과 관련해 문의 드립니다.

0

20

1

작업형1 - 연습문제 16~39 풀이는 몇강을 보면 되나요?

0

47

2

작업형 1 -연습문제 4-6

0

34

2

작업형 1 유형 부분

0

40

2

작업형 1 (삭제예정, 구 버전)

0

50

2

수강기간 연장 문의드립니다.

0

35

1

2유형 레이블 인코딩 VS 원핫 인코딩

0

36

3

수강기간 연장 문의드립니다.

0

38

1

인덱스 슬라이싱

0

35

2

질문 드립니다.

0

50

2

강의 내용 관련 질문드립니다~

0

46

2

수강 연장 문의

0

63

2

강의자료 일괄 다운로드

0

58

2

수강기간 연장 문의드립니다

0

48

2

list 문제 질문드립니다~

0

38

2

빅분기 실기 12회 재도전

0

62

2

강의 기간 연장 가능여부 검토 요청건

0

50

2

수강기간 연장 문의 드립니다

0

46

2

수강기간 연장 문의드립니다

0

52

2

질문이요

0

57

2

수강기간 연장 문의드립니다.

0

60

2

문제 3-2 질문드립니다

0

47

2