해결된 질문
작성
·
638
답변 2
1
Dataset을 train용으로 test용으로 나눌 때 사용합니다. 현업에서 가지고 있는 데이터셋이 만약 10만 rows라고 쳤을 때, 10만 rows를 train에 다 사용해버리면, 만든 모델의 정합성을 실제 사용할 때 어느 수준인지 알 수가 없습니다. 그래서 70퍼센트 또는 80퍼센트는 train용 나머지는 test용으로 씁니다.
0
train_test_split을 나누는 것으로 준비해주세요 :)
제가 나누지 않았던 영상은 정말 간단하게 작성한 코드이거나
"크로스 밸리데이션"을 활용하는 것을 보여주고자 했어요!!!
6회를 준비한다면 시간이 얼마 남지 않았으니 train_test_split을 사용하는 것으로 정리하겠습니다.
답변 감사합니다.