inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

5회 기출유형 (작업형2)

train_test_split는 언제 해야하나요?

해결된 질문

754

빅분기

작성한 질문수 23

0

 

항상 답변 감사합니다.

어떤 문제는 train_test_split로 나누지 않았고, 5회차 작업형2에서는 나눴는데

혹시 어떤 기준인가요?

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 2

1

JUNG JONGSEOK

Dataset을 train용으로 test용으로 나눌 때 사용합니다. 현업에서 가지고 있는 데이터셋이 만약 10만 rows라고 쳤을 때, 10만 rows를 train에 다 사용해버리면, 만든 모델의 정합성을 실제 사용할 때 어느 수준인지 알 수가 없습니다. 그래서 70퍼센트 또는 80퍼센트는 train용 나머지는 test용으로 씁니다.

0

퇴근후딴짓

답변 감사합니다.

0

퇴근후딴짓

train_test_split을 나누는 것으로 준비해주세요 :)

제가 나누지 않았던 영상은 정말 간단하게 작성한 코드이거나

"크로스 밸리데이션"을 활용하는 것을 보여주고자 했어요!!!

6회를 준비한다면 시간이 얼마 남지 않았으니 train_test_split을 사용하는 것으로 정리하겠습니다.

질문 드립니다.

0

24

2

강의 내용 관련 질문드립니다~

0

26

2

수강 연장 문의

0

23

1

강의자료 일괄 다운로드

0

29

2

수강기간 연장 문의드립니다

0

22

1

list 문제 질문드립니다~

0

23

2

빅분기 실기 12회 재도전

0

36

1

강의 기간 연장 가능여부 검토 요청건

0

26

1

수강기간 연장 문의 드립니다

0

32

2

수강기간 연장 문의드립니다

0

42

2

질문이요

0

46

2

수강기간 연장 문의드립니다.

0

42

2

문제 3-2 질문드립니다

0

39

2

수강기간 연장 문의 드립니다.

0

54

2

변수, 칼럼 , df 구분

0

45

2

수강기간 연장 문의드립니다.

0

45

2

수강기간 연장 문의

0

44

2

수강기간 연장 문의드립니다.

0

37

2

수강기한 연장 문의

0

72

2

수강기간 연장 문의드립니다

0

53

2

결정트리에서 적절한 깊이 선택 후 시각화 과정에서 학습 데이터만 사용하는 이유

0

41

2

수강기간 연장 문의드립니다.

0

67

2

수강연장 문의

0

73

2

수강연장문의

0

49

2