작성
·
40
답변 2
0
네 만약 랜덤포레스트 1가지로 제출한다고 하면 굳이 검증 데이터를 분할 안 해도 되겠다 싶어서요 괜히 건드리다가 꼬이면 제출도 못 할 까봐.. 쌤이 예시문제 작업형 2(신유형) 첫번째 제출한 방식으로 하려고 합니다.
그러면은 인코딩까지 동일하게 하고
rf.fit(X_tr, y_tr)을
rf.fit(train, target)으로 바꾼다음
pred = rf.predict(X_val)을
pred = rf.predict(test)로 바꿔주면 되나요??
그러면은 평가하지 않고 제출할 때 랜덤포레스트 기준 요런식으로 작성하면 될까요.?
target = train.pop('농약검출여부')
train = pd.get_dummies(train)
test = pd.get_dummies(test)
train, test = train.align(test, axis=1, join='left', fill_value=0)
from sklearn.ensemble import RandomForestClassifier
rf = RandomForestClassifier(random_state=0)
rf.fit(train, target)
pred = rf.predict(test)
result = pd.DataFrame({'pred':pred})
result.to_csv('result.csv',index=False)
0
짤린다는게 어떤 의미 일까요? 가운데 생략된 부분일까요?
생략은 아래와 같은 처리로 가능은합니다만 행을 다 본다는 것은 어렵습니다. 수천개가 나올 수도 있어요
# 모든 열 출력
pd.set_option('display.max_columns', None)
# 모든 행 출력
pd.set_option('display.max_rows', None)
네 풀이과정은 달라도 됩니다 🙂
네 평가지표로 점수를 확인하지 않는다면 검증데이터를 나눈 의미가 없어요. 그 럴경우 나누지 않고 전체 데이터를 학습용으로 사용하는 것이 더 좋습니다. 평가 하지 않으실려구요??
네!! 맞아요 !
아직 한달이나 남았는데 😂
커리큘럼 아래쪽 팁에
작업형 2 한가지로 풀기 영상이 있습니다 💪💪