inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

작업형2 모의문제2

작업형2 모의문제2 라벨인코딩 과정 중 에러

해결된 질문

1049

ji_nhee

작성한 질문수 13

0

안녕하세요! 강의 진행중 코드에서 오류가 생겨 질문드립니다 ㅠㅠ

라벨인코딩 하는도중


cols = train.select_dtypes(include='object').columns
cols

from sklearn.preprocessing import LabelEncoder

for col in cols :
    le = LabelEncoder()
    train[col] = le.fit_transform(train[col])
    test[col] = le.transform(test[col])

train()

 

이렇게 작성하였으나

TypeError: Encoders require their input to be uniformly strings or numbers. Got ['int', 'str']

이런 오류가 나왔습니다 ㅠㅠ 위의 작성된코드를 살펴봐도 어디가 잘못된지모르겠어서, 또 저 에러가 무슨뜻인지 이해가 안가서 질문드립니다 ㅠ

 

또한, 데이터 전처리 과정 중 다소 불필요한 데이터(?)컬럼(?)을 삭제하지않고 진행할경우 성능이 크게 떨어질까요? ㅠㅠ 괜히 삭제했다가 나중에 뭔가 안맞아서 결과 도출에 오류가 생길까봐 컬럼을 삭제하는게 맘에 걸려서 시험에서는 되도록 그냥 두고싶습니다 ㅠㅠ 괜찮을까요?

 

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 1

0

퇴근후딴짓

코드에는 문제가 없어 보여요
cols = train.select_dtypes(include='object').columns
cols를 한번 찍어보시겠어요? 원하는 컬럼만 있는지 확인 부탁해요. 컬런 선택에 문제가 있어 보여요
cols =['컬럼1', '컬럼2']로 하는 방법도 있습니다.

네, 삭제하지 않고 다 활용해서 진행해도 됩니다. :)
5회까지는 결측치가 없는 데이터만 제공되어 특별히 버릴 컬럼은 없었어요~~!!

다만 이렇게 인코딩 에러가 나면 바로 해결이 안될 경우 어떻게든 제출은 해야 하니 편법으로 수치형 데이터만 선택해서 모델을 학습하는 방법도 있습니다.

뒤로가기 버튼 같은 것이 있나요?

0

8

0

강의 연장 문의

0

10

1

출력값 질문

0

23

2

수업노트가 어디에 있나요?

0

26

1

실기시험 제출관련

0

157

2

6.20 작업형 2 과적합

0

161

3

코딩팡 장업형2 베이스 라인 인코딩 종류 질문

0

51

2

로지스틱회귀, 회귀

0

50

2

회귀 문제를 풀때 질문입니다.

0

58

1

불균형 처리 후 성능이 더 낮아졌다면,

0

63

2

실기 체험 제2유형 에러 문의

0

64

1

LIGHTGBM 으로 하면 pred값이 소수점 6자리까지 나오는게 맞나요

0

51

2

3번문제 등분산 가정

0

49

2

작업형3 target 형 변환 질문

0

35

2

[작업형1] 연습문제 섹션1 ~ 10 의 section4

0

38

3

원핫인코딩과 레이블 인코딩에서 concat

0

59

2

제2유형 질문입니다.

0

47

2

C()

0

44

2

작업형 2에서 strafity 적용 유무

0

52

2

수강 기간 연장 가능 여부 문의드립니다.

0

61

1

ols

0

44

2

2유형 작성관련 질문(일반 심화)

0

40

2

2유형 작성관련 질문

0

41

2

2유형 object컬럼 개수 다르면

0

48

2