해결된 질문
작성
·
568
0
작업형2 기출2회 풀다가 에러가 생겨서 문의드립니다.
원인이 뭘까요...ㅠ
from sklearn.ensemble import RandomForestClassifier
model= RandomForestClassifier(random_state=200)
model.fit(X_tr,y_tr)
pred=model.predict_proba(x_val)
[전체코드]
import pandas as pd
X_train=pd.read_csv('X_train.csv')
y_train=pd.read_csv('y_train.csv')
X_test=pd.read_csv('X_test.csv')
X_train=X_train.drop(['ID'], axis=1)
IDX=X_test.pop('ID')
from sklearn.preprocessing import LabelEncoder
la=LabelEncoder()
cols=['Mode_of_Shipment','Product_importance','Gender']
for col in cols:
X_train[col]=la.fit_transform(X_train[col])
X_test[col]=la.transform(X_test[col])
from sklearn.model_selection import train_test_split
X_tr, X_val, y_tr, y_val=train_test_split(X_train,
y_train['Reached.on.Time_Y.N'],
test_size=0.2,
random_state=200)
# 모델링
from sklearn.ensemble import RandomForestClassifier
model= RandomForestClassifier(random_state=200)
model.fit(X_tr,y_tr)
pred=model.predict_proba(x_val)
답변 2
1
0
다시확인해보니 라벨인코딩할때, Warehouse_block 컬럼을 빠뜨려서 다시추가해주고 돌렸습니다.
그런데, 그래도 다음과 같은 에러가 뜹니다...
ValueError: could not convert string to float: 'D'
오 해결했습니다.
pred=model.predict_proba(x_val)에서 X_val으로 써야하는데 잘못썻네요...
시험장에서 model.fit 에러시에 기존 라벨인코딩에서 object 누락된것이 있는지 확인해 보겠습니다~