인프런 커뮤니티 질문&답변

파뿌리검은머리님의 프로필 이미지
파뿌리검은머리

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

모델링 및 평가(분류)

3-5 Classification 수업에서요.

해결된 질문

작성

·

257

·

수정됨

1

왜 처음부터 데이터를 train_test_split 로 나누고 시작하는게 아니라 마지막에 왜 데이터를 나누어서 다시 시작하는 건가요? train_test_split으로 나누지 않고도 X_train과 y_train만으로도 predict_proba는 적용할 수 있지 않나요?

답변 1

1

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

정확합니다! 나누지 않고 예측하고 제출하면 됩니다.

트레인 데이터를 나누는 이유는 바로 검증데이터를 만들기 위함이에요
이 검증데이터로 내가 만든 모델이 어떤 성능을 보이나 자체 검증할 수 있어요!

파뿌리검은머리님의 프로필 이미지
파뿌리검은머리

작성한 질문수

질문하기