작성한 질문수
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
모델링 및 평가(분류)
해결된 질문
작성
·
257
수정됨
1
왜 처음부터 데이터를 train_test_split 로 나누고 시작하는게 아니라 마지막에 왜 데이터를 나누어서 다시 시작하는 건가요? train_test_split으로 나누지 않고도 X_train과 y_train만으로도 predict_proba는 적용할 수 있지 않나요?
답변 1
정확합니다! 나누지 않고 예측하고 제출하면 됩니다. 트레인 데이터를 나누는 이유는 바로 검증데이터를 만들기 위함이에요 이 검증데이터로 내가 만든 모델이 어떤 성능을 보이나 자체 검증할 수 있어요!