인프런 커뮤니티 질문&답변

huck1123님의 프로필 이미지
huck1123

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

예시문제 작업형2(구 버전): 학습시간 최소화를 위해 구 버전은 삭제하고 있어요!

메모리 오류 관련

해결된 질문

작성

·

288

0

안녕하세요

작업형 2관련 마지막으로 시험환경으로 연습해보고 있는데 갑자기 'killed' 오류 메세지가 나면서 모델링이 되지 않습니다. 기존 코랩과 비슷하게 했는데 어떤 차이가 있을까요??

 

import pandas as pd

X_test = pd.read_csv("data/X_test.csv")

X_train = pd.read_csv("data/X_train.csv")

y_train = pd.read_csv("data/y_train.csv")

# 사용자 코딩

pd.set_option('display.max_columns', None)

pd.options.display.float_format = '{:.3f}'.format

X_train = X_train.drop('cust_id', axis = 1)

cust_id = X_test.pop('cust_id')

X_train = X_train.fillna(0)

X_test = X_test.fillna(0)

cols_n = ['총구매액', '최대구매액', '환불금액', '내점일수', '내점당구매건수', '주말방문비율', '구매주기']

cols_c = ['주구매상품', '주구매지점']

from sklearn.preprocessing import RobustScaler

scaler = RobustScaler()

X_train[cols_n] = scaler.fit_transform(X_train[cols_n])

X_test[cols_n] = scaler.transform(X_test[cols_n])

from sklearn.preprocessing import LabelEncoder

for col in cols_c:

le = LabelEncoder()

X_train[col] = le.fit_transform(X_train[col])

X_test[col] = le.transform(X_test[col])

from sklearn.ensemble import RandomForestClassifier

model = RandomForestClassifier(random_state = 38)

model.fit(X_train, y_train)

pred = model.predict_proba(X_test)

 

답변 1

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

시험상황에서 이런상황이 발생한다면?

어디서 에러나 났는지 모른다면

뒤에서부터 주석처리 시작해주세요 한개씩 해도 되고 작업 단위로 해도 됩니다.

끝에 두 줄을 주석처리하고 나니 실행이 되네요 그럼 끝에서 두번째 코드가 에러가 났네요

무엇이 잘못되었을까요? fit()함수는 제대로 썼으니 데이터가 잘못되었겠네요

X_train.shape과 y_train.shape을 한번 찍어보겠습니다.

y_train.shape 컬럼이 2개네요?? label값(시리즈)만 들어가야 합니다.

이렇게 코드를 고쳐서 입력합니다.

model.fit(X_train, y_train['gender'])

 

huck1123님의 프로필 이미지
huck1123

작성한 질문수

질문하기