해결된 질문
작성
·
288
0
안녕하세요
작업형 2관련 마지막으로 시험환경으로 연습해보고 있는데 갑자기 'killed' 오류 메세지가 나면서 모델링이 되지 않습니다. 기존 코랩과 비슷하게 했는데 어떤 차이가 있을까요??
import pandas as pd
X_test = pd.read_csv("data/X_test.csv")
X_train = pd.read_csv("data/X_train.csv")
y_train = pd.read_csv("data/y_train.csv")
# 사용자 코딩
pd.set_option('display.max_columns', None)
pd.options.display.float_format = '{:.3f}'.format
X_train = X_train.drop('cust_id', axis = 1)
cust_id = X_test.pop('cust_id')
X_train = X_train.fillna(0)
X_test = X_test.fillna(0)
cols_n = ['총구매액', '최대구매액', '환불금액', '내점일수', '내점당구매건수', '주말방문비율', '구매주기']
cols_c = ['주구매상품', '주구매지점']
from sklearn.preprocessing import RobustScaler
scaler = RobustScaler()
X_train[cols_n] = scaler.fit_transform(X_train[cols_n])
X_test[cols_n] = scaler.transform(X_test[cols_n])
from sklearn.preprocessing import LabelEncoder
for col in cols_c:
le = LabelEncoder()
X_train[col] = le.fit_transform(X_train[col])
X_test[col] = le.transform(X_test[col])
from sklearn.ensemble import RandomForestClassifier
model = RandomForestClassifier(random_state = 38)
model.fit(X_train, y_train)
pred = model.predict_proba(X_test)
답변 1
0
시험상황에서 이런상황이 발생한다면?
어디서 에러나 났는지 모른다면
뒤에서부터 주석처리 시작해주세요 한개씩 해도 되고 작업 단위로 해도 됩니다.
끝에 두 줄을 주석처리하고 나니 실행이 되네요 그럼 끝에서 두번째 코드가 에러가 났네요
무엇이 잘못되었을까요? fit()함수는 제대로 썼으니 데이터가 잘못되었겠네요
X_train.shape과 y_train.shape을 한번 찍어보겠습니다.
y_train.shape 컬럼이 2개네요?? label값(시리즈)만 들어가야 합니다.
이렇게 코드를 고쳐서 입력합니다.
model.fit(X_train, y_train['gender'])