인프런 커뮤니티 질문&답변
기출 9회 작업형2 질문
해결된 질문
작성
·
28
0
제가 시험장에서 코드가 생각이 안 날 가능성을 대비해서, 작업형2는 우선 한 가지 방법으로 풀고 거기에 살을 붙여가며 연습하려 합니다.
근데 여기서 든 생각이, 어차피 RandomForest 한 가지 방법으로 풀 거면 모델 성능 측정은 모델 간의 성능을 비교할 목적이니 굳이 안 해도 될 것 같고, 성능 측정을 하지 않는다면 train과 validation을 나눠주는 train_test_split도 굳이 안 해도 될 것 같고, 결론적으로는 경우에 따라 Classifier/Regressor만 맞게 써준다면 아래의 코드만으로도 웬만한 문제는 감점당하지 않고 넘어갈 수 있지 않나 하는 생각이 들었습니다.
target = train.pop('농약검출여부')
train = pd.get_dummies(train)
test = pd.get_dummies(test)
test = test.reindex(columns=train.columns, fill_value=0)
from sklearn.ensemble import RandomForestClassifier
model = RandomForestClassifier(random_state=0)
model.fit(train, target)
pred = model.predict(test)
pd.DataFrame({'pred': pred}).to_csv('result.csv', index=False)
pd.read_csv('result.csv')강사님께서 올려주신 실기 응시 가이드를 보니 성능이 너무 낮지만 않다면 점수가 많이 까일 가능성은 낮아보여서, 우선은 이걸로 밀고 가면서 최소한의 점수는 확보하려는데, 그러한 목적으로는 이 코드가 문제가 없을지 궁금합니다.
감사합니다.
답변 1
0
퇴근후딴짓
지식공유자
정확합니다. 회귀와 분류만 구분 잘하면 됩니다.
평가 지표를 사용한다는 기준은 결측치도 나오고해야
결측치 처리를 비교해 보기도 하고 모델도 비교해 보기도 합니다.
다만 분류는 2가지 케이스로 나눠야해서. 결론, 총 3가지 케이스로 준비해야 합니다.
아래 영상 한번 봐주세요






아 이런 영상이 있는 줄 몰랐네요 ㅜㅜ 감사합니다!