작성
·
58
0
안녕하세요.
제2회 기출, 제2유형 아래와같이 풀어봤는데 확인 부탁드립니다.
랜포활용
검증안함
검증은 어차피 시험에 반영안되고,
랜포밖에 할 줄 몰라서 이것만 암기했어요.
도저히 다른거 풀 자신이 없어서
시험 제2유형의 모든문제는 아래 패턴으로 진행하려합니다.
혹시 이렇게 진행해도되는지 문의드립니다.
# 데이터 불러오기
import pandas as pd
test = pd.read_csv("X_test.csv")
train = pd.read_csv("X_train.csv")
y_train = pd.read_csv("y_train.csv")
X_train.shape, y_train.shape, X_test.shape
# train.info()
# test.info()
# y_train.info()
target = y_train.pop('Reached.on.Time_Y.N')
train = pd.get_dummies(train)
test = pd.get_dummies(test)
train, test = train.align(test, join='left', axis = 1)
from sklearn.model_selection import train_test_split
x_tr, x_val, y_tr, y_val = train_test_split(train, target, test_size=0.2, random_state=0)
from sklearn.ensemble import RandomForestClassifier
rf = RandomForestClassifier(random_state = 0)
rf.fit(x_tr, y_tr)
pred = rf.predict_proba(test)
test_ID = test.pop('ID')
submit = pd.DataFrame({'ID' : test_ID, 'Reached.on.Time_Y.N' : pred[:,1]})
submit.to_csv('result.csv', index=False)
답변 1
0
모든 문제에 적용하는 것이라면
현재 기준, 섹션 20 - 기출(작업형2) 한 가지 방법으로 풀기
영상으로 추천드립니다.
위 방식은 저도 모든 시험환경을 테스트 해본 것이 아니라 장담할 수가 없을 것 같습니다.
특히 train, test = train.align(test, join='left', axis = 1)
이 새로운 방법이네요! 👍
지금은 조금 어렵지만, 시간 날 때 이 방식으로 직접 테스트해 보겠습니다.
이론적으로는 train 쪽 기준으로 맞출지, test 쪽 기준으로 맞출지만 정하면 되는 거네요.