inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

4회 기출 유형(작업형2)

4회 작업형 2 문제

해결된 질문

159

조현우

작성한 질문수 6

0

안녕하세요 강사님 수업 잘 듣고 있습니다!

다름이 아니라 제가 분류/회귀 문제에서

랜덤포레스트와 xgboost 두 가지 코딩을 이용하려 하는데

이번 문제의 경우 랜덤포레스트는 돌아가지만

xgboost 같은 경우는 오류가 발생하더라구요

모든 데이터에 사용 가능한 줄 알았는데

데이터마다 사용할 수 있는 모델이 한정적인가요??

from xgboost import XGBClassifier 
model = XGBClassifier() 
model.fit(X_tr, y_tr) 
pred = moedl.predict(X_val)

위와 같이 실행했고, 아래는 에러코드입니다!

ValueError: Invalid classes inferred from unique values of `y`.  Expected: [0 1 2 3], got [1 2 3 4]


python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 2

0

퇴근후딴짓

네, xgboost는 까다로운 부분이 있어요 타겟이 반드시 숫자여야 하고 [0 1 2 3] 과 같이 0부터 차례대로 타겟이 정의되어 있어야 해요

이 작업을 하려면 타겟을 변환하고 예측한 뒤에 다시 또 타겟을 복구하는 작업이 필요해서 실수할 가능성이 커집니다. 부스팅계열 모델 중 xgboost보다는 lightgbm을 추천합니다. 이 모델 강의 영상 참고 바랍니다. 감사합니다.

0

인프런 AI 인턴

안녕하세요, 인프런 AI 인턴입니다.

조현우님의 질문에 대하여, 유사한 상황을 겪으신 다른 수강생의 질문과 그에 대한 답변을 찾았습니다.

문제의 핵심은 xgboost 모델이 class labeling을 0부터 시작하는 것을 기대하는데 반해, 제공된 y 데이터가 1부터 시작하는 레이블을 가지고 있다는 것입니다. 이 때문에 ValueError: Invalid classes inferred from unique values ofy. Expected: [0 1 2 3], got [1 2 3 4]와 같은 오류가 발생합니다.

해결 방안으로는, y 값의 레이블을 0부터 시작하도록 조정한 뒤 모델을 다시 학습시켜야 합니다. 예를 들어, y 데이터에 -1을 하여 클래스 레이블을 조정할 수 있습니다.

이와 관련하여 비슷한 문제를 겪었던 다른 수강생의 질문과, 이에 대한 답변 링크를 아래에 첨부합니다:

이 답변이 조현우님의 문제를 해결하는 데 도움이 되길 바랍니다. 추가적으로 궁금한 점이 더 있으시면, 언제든지 질문해 주세요.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

질문 드립니다.

0

38

2

강의 내용 관련 질문드립니다~

0

35

2

수강 연장 문의

0

33

1

강의자료 일괄 다운로드

0

43

2

수강기간 연장 문의드립니다

0

29

1

list 문제 질문드립니다~

0

31

2

빅분기 실기 12회 재도전

0

40

1

강의 기간 연장 가능여부 검토 요청건

0

30

1

수강기간 연장 문의 드립니다

0

36

2

수강기간 연장 문의드립니다

0

47

2

질문이요

0

51

2

수강기간 연장 문의드립니다.

0

50

2

문제 3-2 질문드립니다

0

44

2

수강기간 연장 문의 드립니다.

0

58

2

변수, 칼럼 , df 구분

0

50

2

수강기간 연장 문의드립니다.

0

50

2

수강기간 연장 문의

0

48

2

수강기간 연장 문의드립니다.

0

42

2

수강기한 연장 문의

0

80

2

수강기간 연장 문의드립니다

0

57

2

결정트리에서 적절한 깊이 선택 후 시각화 과정에서 학습 데이터만 사용하는 이유

0

45

2

수강기간 연장 문의드립니다.

0

71

2

수강연장 문의

0

77

2

수강연장문의

0

53

2