작성
·
27
·
수정됨
0
네, 데이터를 나누지 않고 전체데이터를 학습하고, 평가지표 검정 없이 test 예측결과를 바로 제출해도됩니다. 회귀와 분류만 틀리지 않으면 큰 문제는 없습니다.
===========답변해주셔서 너무 감사합니다.
근데 죄송하지만 답변 보고 더 모르겠어서 부득이 재질문드려요...ㅠㅠ
저는 아래와 같이 6번에서 평가지표 점정만 빼도 될지를 여쭤봤던건데
아래와 같이 해도 40점을 받을 수 있을까요.. 한번 더 여쭤봐서 번거롭게 해 죄송해요.
3. EDA
4. 전처리
target = train.pop('열이름')
print(train.shape, test.shape)
train = pd.get_dummies(train)
test = pd.get_dummies(test)
print(train.shape, test.shape)
5. 분할
from sklearn.model_selection import train_test_split
X_tr, X_val, y_tr, y_val = train_test_split(train, target, test_size=0.2, random_state=0)
print(X_tr.shape, X_val.shape, y_tr.shape, y_val.shape)
6. 학습
from sklearn.ensemble import RandomForestClassifier #분류 // # 회귀: RandomForestRegressor
rf = RandomForestClassifier(random_state=0)
rf.fit(X_tr, y_tr)
pred = rf.predict(X_val)
7.예측
pred = rf.predict(test)
submit = pd.DataFrame({'pred':pred[:,1]})
submit.to_csv("result.csv", index=False)
==============================================
작업형2 한가지로만 푸는 것이 7회까지만 되어 있는데
8회 작업형 2도 위와 같이 쭉 진행해보면
MAE가 946.9158838362998로 강의보다 오히려 줄어드는 것 같습니다.
답변