[MOCK EXAM] T2. EXAM template-캐글 모의고사
0
강사님 안녕하세요 🙂
kaggle에 올려주신 모의 고사 문제 풀이 중인데 모의고사 문제 작업형2에서 RandomForestClassifier로 진행하여 예측 csv를 만들었지만 다른 방법도 시도해보고자 XGBoost도 실행해보니 오류가 뜨더라구요 이 문제에서는 XGBoost 모델링이 힘든건가 하여 질문드려요 😢
# XGBoost(오류)
from xgboost import XGBClassifier
xgb = XGBClassifier()
xgb.fit(X_tr,y_tr)
pred = xgb.predict_proba(X_val)[:,1]
roc_auc_score(y_val,pred)

답변 1
1
xgboost가 좀 예민해요
오류 명으로 봐서는 컬러명에 특수 문자를 포함하고 있어서 그런 것 같네요~!
부스팅 계열 중에 좀 덜 예민한 lightgbm을 추천합니다!
# 컬럼명 변경 예시코드
import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]})
df = df.rename(columns={'A': 'Col_1', 'B': 'Col_2', 'C': 'Col_3'})
print(df)lightgbm 코드
####### 분류 #######
import lightgbm as lgb
model = lgb.LGBMClassifier()
model.fit(X_train, y_train)
y_pred = model.predict(X_test)
# y_pred = model.predict_proba(X_test) #평가기준 roc-auc일 때
####### 회귀 #######
import lightgbm as lgb
model = lgb.LGBMRegressor()
model.fit(X_train, y_train)
y_pred = model.predict(X_test)
작업형1 - 연습문제 16~39 풀이는 몇강을 보면 되나요?
0
23
1
작업형 1 -연습문제 4-6
0
21
1
작업형 1 유형 부분
0
31
2
작업형 1 (삭제예정, 구 버전)
0
46
2
수강기간 연장 문의드립니다.
0
31
1
2유형 레이블 인코딩 VS 원핫 인코딩
0
35
3
수강기간 연장 문의드립니다.
0
33
1
인덱스 슬라이싱
0
33
2
질문 드립니다.
0
46
2
강의 내용 관련 질문드립니다~
0
44
2
수강 연장 문의
0
61
2
강의자료 일괄 다운로드
0
55
2
수강기간 연장 문의드립니다
0
45
2
list 문제 질문드립니다~
0
36
2
빅분기 실기 12회 재도전
0
58
2
강의 기간 연장 가능여부 검토 요청건
0
44
2
수강기간 연장 문의 드립니다
0
44
2
수강기간 연장 문의드립니다
0
52
2
질문이요
0
56
2
수강기간 연장 문의드립니다.
0
58
2
문제 3-2 질문드립니다
0
47
2
수강기간 연장 문의 드립니다.
0
61
2
변수, 칼럼 , df 구분
0
51
2
수강기간 연장 문의드립니다.
0
50
2





