inflearn logo
강의

講義

知識共有

[仕事終わりの趣味] ビッグデータ分析実技 (作業型1,2,3)

第5回既出タイプ(作業型2)

train_test_split는 언제 해야하나요?

解決済みの質問

762

dudgus4532234

投稿した質問数 23

0

 

항상 답변 감사합니다.

어떤 문제는 train_test_split로 나누지 않았고, 5회차 작업형2에서는 나눴는데

혹시 어떤 기준인가요?

python 머신러닝 빅데이터 pandas 빅데이터분석기사

回答 2

1

JUNG JONGSEOK

Dataset을 train용으로 test용으로 나눌 때 사용합니다. 현업에서 가지고 있는 데이터셋이 만약 10만 rows라고 쳤을 때, 10만 rows를 train에 다 사용해버리면, 만든 모델의 정합성을 실제 사용할 때 어느 수준인지 알 수가 없습니다. 그래서 70퍼센트 또는 80퍼센트는 train용 나머지는 test용으로 씁니다.

0

roadmap

답변 감사합니다.

0

roadmap

train_test_split을 나누는 것으로 준비해주세요 :)

제가 나누지 않았던 영상은 정말 간단하게 작성한 코드이거나

"크로스 밸리데이션"을 활용하는 것을 보여주고자 했어요!!!

6회를 준비한다면 시간이 얼마 남지 않았으니 train_test_split을 사용하는 것으로 정리하겠습니다.

예시문제 작업형2 (ver2023) 질문입니다

0

6

1

Data type에 따른 처리

0

4

1

데이터 전처리 관련

0

9

2

시험에서 문제 불러오기

0

7

2

2번문제 출력값 질문

0

12

2

pd.get_dummies()가 bool로 반환

0

14

2

대응표본검정 레빈

0

17

3

단일표본검정 문제 유형

0

17

2

[작업형 3] 6~7. 카이제곱 검정

0

15

2

9회 작업형3 문제 1-1

0

27

2

최종답안 계산 방식 질문

0

17

1

시험 치기 전 급하게 질문 사항

0

29

2

유형3

0

28

2

작업형 2 연습문제 섹션 3

0

18

2

11 기출문제 ipynb파일

0

27

2

작업형 3 유형

0

25

2

11회 기출 유형(작업형1) 2번 정답

0

23

2

f1 score 질문

0

19

2

10회 작업형 2 인코딩 질의

0

19

2

53번 강의에서 갑자기 수업노트가 없어졌습니다.

0

26

2

28:19 roc_auc이유

0

24

2

수강연장문의

0

26

2

전체적인 머신러닝 순서

0

28

2

빅분기 실기 유형2질문

0

28

1