inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

예시문제 작업형2(ver. 2023)

예시문제 작업형 2번

해결된 질문

187

김주원

작성한 질문수 4

0

import pandas as pd
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import roc_auc_score
from sklearn.model_selection import train_test_split
train = pd.read_csv("data/customer_train.csv") #3500
test = pd.read_csv("data/customer_test.csv") #2482

train['환불금액'] = train['환불금액'].fillna(0)
test['환불금액'] = test['환불금액'].fillna(0)
#print(train.isnull().sum().sum())
cols = ['회원ID','총구매액','최대구매액','환불금액','방문일수','방문당구매건수','주말방문비율','구매주기']

target = train.pop('성별')
#용자 코딩
#print(train['성별'].value_counts()) #여2남1
train = pd.get_dummies(train)
test = pd.get_dummies(test)


xtr,xval,ytr,yval = train_test_split(train[cols],target,test_size = 0.2, random_state = 0)
print(xtr.shape,xval.shape,ytr.shape,yval.shape)

rf = RandomForestClassifier()
rf.fit(xtr[cols],ytr)
pred = rf.predict_proba(xval[cols])

pred = rf.predict_proba(test[cols])
submit = pd.DataFrame({'pred':pred[:,1]})

submit.to_csv('result.csv',index=False)
result=pd.read_csv('result.csv')
print(result.shape)
print(result.head())


강의에서처럼 마지막 제출 pred 변수 만들 때 rf.predict_proba(test) 하니까 안만들어져서 rf.predict_proba(test[cols])로 생성했는데, 맞게 코딩한건가요?

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 1

0

퇴근후딴짓

학습할 때

rf.fit(xtr[cols],ytr) 로 cols 컬럼만 사용했기 때문에

예측할 때도rf.predict_proba(test[cols])로 사용하는 것이에요

 

학습을

rf.fit(xtr,ytr)로 진행하고, rf.predict_proba(test)로 예측하면 됩니다.

질문 드립니다.

0

38

2

강의 내용 관련 질문드립니다~

0

35

2

수강 연장 문의

0

33

1

강의자료 일괄 다운로드

0

43

2

수강기간 연장 문의드립니다

0

29

1

list 문제 질문드립니다~

0

31

2

빅분기 실기 12회 재도전

0

40

1

강의 기간 연장 가능여부 검토 요청건

0

30

1

수강기간 연장 문의 드립니다

0

36

2

수강기간 연장 문의드립니다

0

47

2

질문이요

0

51

2

수강기간 연장 문의드립니다.

0

50

2

문제 3-2 질문드립니다

0

44

2

수강기간 연장 문의 드립니다.

0

58

2

변수, 칼럼 , df 구분

0

50

2

수강기간 연장 문의드립니다.

0

50

2

수강기간 연장 문의

0

48

2

수강기간 연장 문의드립니다.

0

42

2

수강기한 연장 문의

0

80

2

수강기간 연장 문의드립니다

0

57

2

결정트리에서 적절한 깊이 선택 후 시각화 과정에서 학습 데이터만 사용하는 이유

0

45

2

수강기간 연장 문의드립니다.

0

71

2

수강연장 문의

0

77

2

수강연장문의

0

53

2