작업형2번 푸는 것에있어서
44
작성한 질문수 3
전처리부분은 어떻게 나올지 모르겠지만 여태까지 난이도로나온다면 (결측치는 나오는대로 한다고 가정하겠습니다)
강의를 다보고 연습문제도 다해보았습니다 작업형3도 다돌려보았고 작업형1이 잘 안되어서 남은시간동안 작업형1에 집중해보려고 여쭙니다
이정도 치면 40점을 맞을 수 있다고생각하는데 어떻게 생각하실까요?ㅠ
(타겟값분리)
target=train.pop('종속변수')
(데이터합쳐서 원핫인코딩 후 분해)
n1=len(train)
df=pd.concat([train,test])
df=pd.get_dummies(df)
train=df.iloc[:n1]
test=df.iloc[n1:]
데이터분할
from sklearn.model_selection import train_test_split
X_tr,X_val,y_tr,y_val=import train_test_split(train,target,test_size=0.2,random_state=0)
X_tr.shape,X_val.shape,y_tr.shape,y_val.shape
#평가지표
from sklearn.metrics import root_mean_squared_error # f1_score , roc_auc_score 등등나오는대로
#랜덤포레스트
from sklearn.ensemble import RandomForestClassifier # 분류
#from sklearn.ensemble import RandomForestRegressor #회귀
rf=RandomForestClassifier()
rf.fit(X_tr,y_tr)
pred=rf.predict(X_val)
print(root_mean_squared_error(y_val,pred) # macro일때는 average='macro'
#lightgbm
import lightgbm import lgb
lgb=lgb.LGBMClassifier(random_state=0,verbose=-1) # 회귀면 Regressor
lgb.fit(X_tr,y_tr)
pred=lgb.predict(X_val)
print(root_mean_squared_error(y_val,pred)
test예측
pred=rf.predict(test) #rf와lgbm중 선택
submit=pd.DataFrame({'pred':pred)} # roc_auc인경우 pred[,:1]
submit.to_csv('result.csv',index=False)
print(pd.read_csv('result.csv'))
답변 1
전체적인 머신러닝 순서
0
3
1
빅분기 실기 유형2질문
0
5
0
ID 전처리 이유
0
17
2
데이터제공
0
17
2
예시문제 작업형3 꼬리질문2번
0
8
0
데이터 개수를 구할 때, len과 value_counts 차이
0
14
2
작업형 2 제출방
0
12
2
인코딩 스케일링 순서
0
16
2
실제 시험에서도 공식을 문제에서 주는지
0
14
2
수강 연장 문의
0
13
2
작업형2 정리한 내용 확인 부탁드립니다 ㅜㅜ
0
18
1
14강 "" 사용 관련 질문
0
17
2
캐글 제출 점수
0
23
2
기출 마무리 방법
0
45
2
빅이시 작업형2 기초 - 케이스 1~3 관련 문의
0
28
2
데이터프레임 슬라이싱 인덱싱 질문2
0
27
2
단일표본검정, 샤피로검정, 윌콕슨검정
0
36
2
강의자료 다운로드 여부
0
38
2
문제에 첨부된 예시와 실제 출력된 샘플 비교
0
30
2
원핫 인코딩 관련
0
38
2
타겟 분리
0
39
2
Id 삭제
0
44
2
roc_auc_score 질문: 작업형2 모의문제3 09분 48초
0
39
2
원핫인코딩 코드 질문
0
36
2





