인프런 커뮤니티 질문&답변

김민지님의 프로필 이미지
김민지

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

Train 데이터 학습 관련

해결된 질문

작성

·

269

0

시험 전에 여쭤봤어야 하는 질문인데 뒤늦게 여쭤보네요

 

Train test split 사용하여 tr 과 val 로 나누어서 model.fit 하여서 f1 score 확인 하였고

그 이후에 test 를 바로 predict 하여 제출 하는게 아니라

혹시

Tr 과 val 을 나누기 전의

전체 train 데이터로 다시 fit 시켜서

그 모델로

Test 데이터 를 predict 해도 되는지 궁금 합니다

 

 

 

답변 1

1

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

네 둘다 가능합니다 :) 드라마틱한 차이는 없을 것이에요

다만 전자는 확인이 가능한 모델로 제출하는 것이고

후자는 성능이 더 올라갈 수도 있고 떨어질 수도 있어요! 튜닝이되었다면 트레인에서 검증데이터를

분리한 상태에서 튜닝이되어있기 때문이에요

전체데이터셋을 학습용으로 사용할때는 크로스 밸리데이션을 활용합니다

김민지님의 프로필 이미지
김민지
질문자

설명 감사합니다! 하이퍼 파라메터 쓰니까 오히려 성능이 안좋아지는거 같아서 순정 스타일로 사용했어요 ㅎㅁㅎ

김민지님의 프로필 이미지
김민지

작성한 질문수

질문하기