train_test_split는 언제 해야하나요?
항상 답변 감사합니다.
어떤 문제는 train_test_split로 나누지 않았고, 5회차 작업형2에서는 나눴는데
혹시 어떤 기준인가요?
Answer 2
1
Dataset을 train용으로 test용으로 나눌 때 사용합니다. 현업에서 가지고 있는 데이터셋이 만약 10만 rows라고 쳤을 때, 10만 rows를 train에 다 사용해버리면, 만든 모델의 정합성을 실제 사용할 때 어느 수준인지 알 수가 없습니다. 그래서 70퍼센트 또는 80퍼센트는 train용 나머지는 test용으로 씁니다.
0
train_test_split을 나누는 것으로 준비해주세요 :)
제가 나누지 않았던 영상은 정말 간단하게 작성한 코드이거나
"크로스 밸리데이션"을 활용하는 것을 보여주고자 했어요!!!
6회를 준비한다면 시간이 얼마 남지 않았으니 train_test_split을 사용하는 것으로 정리하겠습니다.
작업형3 기출
0
6
1
유형2에서 데이터분할 생략 가능여부
0
7
1
9회 기출 유형3 질문
0
7
1
lgb 기초편
0
5
1
괄호 사용
0
9
1
작업형 2 데이터 전처리 질문
0
9
0
11회 기출 유형 작업형1 문제 3-1
0
9
0
예시문제 작업형2 (ver2023) 질문입니다
0
10
1
Data type에 따른 처리
0
7
1
데이터 전처리 관련
0
13
2
시험에서 문제 불러오기
0
12
2
2번문제 출력값 질문
0
17
2
pd.get_dummies()가 bool로 반환
0
16
2
대응표본검정 레빈
0
20
3
단일표본검정 문제 유형
0
20
2
[작업형 3] 6~7. 카이제곱 검정
0
16
2
9회 작업형3 문제 1-1
0
32
2
최종답안 계산 방식 질문
0
19
1
시험 치기 전 급하게 질문 사항
0
34
2
유형3
0
29
2
작업형 2 연습문제 섹션 3
0
20
2
11 기출문제 ipynb파일
0
32
2
작업형 3 유형
0
27
2
11회 기출 유형(작업형1) 2번 정답
0
28
2

