inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

작업형2번 푸는 것에있어서

44

문정현

작성한 질문수 3

0

전처리부분은 어떻게 나올지 모르겠지만 여태까지 난이도로나온다면 (결측치는 나오는대로 한다고 가정하겠습니다)

강의를 다보고 연습문제도 다해보았습니다 작업형3도 다돌려보았고 작업형1이 잘 안되어서 남은시간동안 작업형1에 집중해보려고 여쭙니다

 

이정도 치면 40점을 맞을 수 있다고생각하는데 어떻게 생각하실까요?ㅠ

(타겟값분리)

target=train.pop('종속변수')


(데이터합쳐서 원핫인코딩 후 분해)

n1=len(train)

df=pd.concat([train,test])

df=pd.get_dummies(df)

train=df.iloc[:n1]

test=df.iloc[n1:]


데이터분할

from sklearn.model_selection import train_test_split

X_tr,X_val,y_tr,y_val=import train_test_split(train,target,test_size=0.2,random_state=0)

X_tr.shape,X_val.shape,y_tr.shape,y_val.shape


#평가지표

from sklearn.metrics import root_mean_squared_error # f1_score , roc_auc_score 등등나오는대로

 

#랜덤포레스트

from sklearn.ensemble import RandomForestClassifier # 분류

#from sklearn.ensemble import RandomForestRegressor #회귀

rf=RandomForestClassifier()

rf.fit(X_tr,y_tr)

pred=rf.predict(X_val)

print(root_mean_squared_error(y_val,pred) # macro일때는 average='macro'

#lightgbm

import lightgbm import lgb

lgb=lgb.LGBMClassifier(random_state=0,verbose=-1) # 회귀면 Regressor

lgb.fit(X_tr,y_tr)

pred=lgb.predict(X_val)

print(root_mean_squared_error(y_val,pred)

 

test예측

pred=rf.predict(test) #rf와lgbm중 선택

submit=pd.DataFrame({'pred':pred)} # roc_auc인경우 pred[,:1]

submit.to_csv('result.csv',index=False)

print(pd.read_csv('result.csv'))

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 1

1

퇴근후딴짓

네 2개의 모델 비교하려는거죠?

문제 없습니다 40점!!! 화이팅 🙂

1

문정현

네 맞습니다! 감사합니다 비전공자인데 강의정말 잘들었습니다 합격하고오겠습니다!

0

퇴근후딴짓

넵!! 합격 기원합니다.

전체적인 머신러닝 순서

0

3

1

빅분기 실기 유형2질문

0

5

0

ID 전처리 이유

0

17

2

데이터제공

0

17

2

예시문제 작업형3 꼬리질문2번

0

8

0

데이터 개수를 구할 때, len과 value_counts 차이

0

14

2

작업형 2 제출방

0

12

2

인코딩 스케일링 순서

0

16

2

실제 시험에서도 공식을 문제에서 주는지

0

14

2

수강 연장 문의

0

13

2

작업형2 정리한 내용 확인 부탁드립니다 ㅜㅜ

0

18

1

14강 "" 사용 관련 질문

0

17

2

캐글 제출 점수

0

23

2

기출 마무리 방법

0

45

2

빅이시 작업형2 기초 - 케이스 1~3 관련 문의

0

28

2

데이터프레임 슬라이싱 인덱싱 질문2

0

27

2

단일표본검정, 샤피로검정, 윌콕슨검정

0

36

2

강의자료 다운로드 여부

0

38

2

문제에 첨부된 예시와 실제 출력된 샘플 비교

0

30

2

원핫 인코딩 관련

0

38

2

타겟 분리

0

39

2

Id 삭제

0

44

2

roc_auc_score 질문: 작업형2 모의문제3 09분 48초

0

39

2

원핫인코딩 코드 질문

0

36

2