인프런 커뮤니티 질문&답변

수지님의 프로필 이미지
수지

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

[MOCK EXAM] T2. EXAM template-캐글 모의고사

해결된 질문

작성

·

132

·

수정됨

0

강사님 안녕하세요 🙂

kaggle에 올려주신 모의 고사 문제 풀이 중인데 모의고사 문제 작업형2에서 RandomForestClassifier로 진행하여 예측 csv를 만들었지만 다른 방법도 시도해보고자 XGBoost도 실행해보니 오류가 뜨더라구요 이 문제에서는 XGBoost 모델링이 힘든건가 하여 질문드려요 😢

# XGBoost(오류)

from xgboost import XGBClassifier

xgb = XGBClassifier()

xgb.fit(X_tr,y_tr)

pred = xgb.predict_proba(X_val)[:,1]

roc_auc_score(y_val,pred)

답변 1

1

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

xgboost가 좀 예민해요

오류 명으로 봐서는 컬러명에 특수 문자를 포함하고 있어서 그런 것 같네요~!

부스팅 계열 중에 좀 덜 예민한 lightgbm을 추천합니다!

# 컬럼명 변경 예시코드
import pandas as pd

df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]})

df = df.rename(columns={'A': 'Col_1', 'B': 'Col_2', 'C': 'Col_3'})
print(df)

lightgbm 코드

####### 분류  #######
import lightgbm as lgb
model = lgb.LGBMClassifier()
model.fit(X_train, y_train)
y_pred = model.predict(X_test)
# y_pred = model.predict_proba(X_test) #평가기준 roc-auc일 때


####### 회귀  #######
import lightgbm as lgb
model = lgb.LGBMRegressor()
model.fit(X_train, y_train)
y_pred = model.predict(X_test)
수지님의 프로필 이미지
수지

작성한 질문수

질문하기