28. 모델링 및 평가(분류) 강의 중 xgboost 관련
강의를 들으며 빈칸노트북에 바로바로 따라해보고 있습니다.
다만, 의사결정나무 랜덤포레스트는 이상없이 예측값이 나오는데
xgboost는 datatype 오류가 나옵니다.
이유가 무엇인지 알수 있을까요?


답변 3
0
테스트 해보니 정상적입니다.
혹시 결측치가 처리되지 않은 데이터가 모델에 들어갔을까요?
XGB모델이 있는 셀에 마우스를 클릭해 커서를 두고
런타임 - 이전셀실행 을 한다음 XGB모델이 있는 셀을 실행해봐 주시겠어요?
0
안녕하세요, 인프런 AI 인턴입니다.
XGBoost 사용 시 데이터 타입 오류가 발생하는 경우에 대해서 몇 가지 해결책을 제안드리겠습니다. 종종 이러한 오류는 데이터 내에 포함된 잘못된 형식(예: 문자열 데이터가 포함된 열)이 있는 경우 발생할 수 있습니다.
데이터 타입 확인: 사용 중인 데이터셋의 모든 열이 숫자인지, 범주형 변수는 적절히 인코딩되어 있는지 확인해야 합니다. scikit-learn의
LabelEncoder나OneHotEncoder를 사용하여 문자열 데이터를 숫자형으로 변환해 보세요.Null 값 처리: XGBoost는 결측값을 따로 처리하지 않으면 오류를 발생시킬 수 있습니다. 결측값을 평균값이나 최빈값으로 채우거나, 적절한 다른 방법으로 처리해 주세요.
데이터 변환: 데이터셋에 NaN 값이나, 유효하지 않은 값이 포함되어 있는지 체크해보세요.
XGBoost.DMatrix로 데이터를 변환하기 전에 데이터셋을 정제하여 이러한 문제를 해결할 수 있습니다.
관련된 유사한 오류 해결에 대한 질문과 답변들을 아래에서 확인하실 수 있습니다:
XGBoost 실행 중 에러 관련 문의드립니다~!: 코드에서 피처(컬럼) 이름이 중복되거나 같은 경우, 데이터에 포함된 컬럼의 이름을 중복 작성하는 실수가 있을 수 있습니다. 이 링크에서 어떻게 문제를 해결했는지 확인해 보세요.
4회 기출 유형(작업형2)의 xgb 에러 관련: 클래스를 0,1,2,3 형태로 구성해야 XGBoost가 문제없이 학습이 가능합니다. 클래스를 재정의하는 방법을 참고하여 시도해 보세요.
추가적으로, 데이터셋의 dtypes 속성을 출력하여 문제의 열이 어떤 것인지 확인하는 것이 좋습니다. 만약 문제가 지속된다면, 관련 코드와 데이터 샘플을 공유해 주시면 더욱 구체적인 해결 방법을 제공할 수 있습니다.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.
뒤로가기 버튼 같은 것이 있나요?
0
28
1
강의 연장 문의
0
32
1
출력값 질문
0
31
2
수업노트가 어디에 있나요?
0
29
1
실기시험 제출관련
0
160
2
6.20 작업형 2 과적합
0
169
3
코딩팡 장업형2 베이스 라인 인코딩 종류 질문
0
54
2
로지스틱회귀, 회귀
0
52
2
회귀 문제를 풀때 질문입니다.
0
59
1
불균형 처리 후 성능이 더 낮아졌다면,
0
66
2
실기 체험 제2유형 에러 문의
0
66
1
LIGHTGBM 으로 하면 pred값이 소수점 6자리까지 나오는게 맞나요
0
52
2
3번문제 등분산 가정
0
50
2
작업형3 target 형 변환 질문
0
38
2
[작업형1] 연습문제 섹션1 ~ 10 의 section4
0
40
3
원핫인코딩과 레이블 인코딩에서 concat
0
62
2
제2유형 질문입니다.
0
49
2
C()
0
44
2
작업형 2에서 strafity 적용 유무
0
53
2
수강 기간 연장 가능 여부 문의드립니다.
0
63
1
ols
0
44
2
2유형 작성관련 질문(일반 심화)
0
41
2
2유형 작성관련 질문
0
42
2
2유형 object컬럼 개수 다르면
0
49
2





