inflearn logo
강의

Khóa học

Chia sẻ kiến thức

[Làm gì sau giờ làm] Chứng chỉ Phân tích Dữ liệu lớn - Kỳ thi thực hành (Dạng bài tập 1, 2, 3)

Đề thi mẫu lần 5 (Loại hình công việc 2)

train_test_split는 언제 해야하나요?

Đã giải quyết

762

dudgus4532234

23 câu hỏi đã được viết

0

 

항상 답변 감사합니다.

어떤 문제는 train_test_split로 나누지 않았고, 5회차 작업형2에서는 나눴는데

혹시 어떤 기준인가요?

python 머신러닝 빅데이터 pandas 빅데이터분석기사

Câu trả lời 2

1

JUNG JONGSEOK

Dataset을 train용으로 test용으로 나눌 때 사용합니다. 현업에서 가지고 있는 데이터셋이 만약 10만 rows라고 쳤을 때, 10만 rows를 train에 다 사용해버리면, 만든 모델의 정합성을 실제 사용할 때 어느 수준인지 알 수가 없습니다. 그래서 70퍼센트 또는 80퍼센트는 train용 나머지는 test용으로 씁니다.

0

roadmap

답변 감사합니다.

0

roadmap

train_test_split을 나누는 것으로 준비해주세요 :)

제가 나누지 않았던 영상은 정말 간단하게 작성한 코드이거나

"크로스 밸리데이션"을 활용하는 것을 보여주고자 했어요!!!

6회를 준비한다면 시간이 얼마 남지 않았으니 train_test_split을 사용하는 것으로 정리하겠습니다.

기출 11회 작업형 2_전체 데이터 학습 여부

0

15

1

예측값 결과 소수점 차이

0

18

2

기출 문제와 실전챌린지 연습문제 무엇부터 푸는게 나은가요?

0

14

0

전처리 train() test([ ])

0

16

2

작업형 1 배경지식 질문

0

19

2

옳게 풀은건지 질문드립니다!

0

14

1

roc_auc_score

0

22

2

추가질문 합니다

0

16

2

시험환경 구름

0

18

2

2유형 질문드려요

0

15

2

RandomForest vs lgb

0

23

2

전처리 관련질문

0

23

3

작업형3 기출

0

17

2

유형2에서 데이터분할 생략 가능여부

0

29

2

9회 기출 유형3 질문

0

19

2

lgb 기초편

0

14

1

괄호 사용

0

23

2

작업형 2 데이터 전처리 질문

0

21

1

11회 기출 유형 작업형1 문제 3-1

0

19

1

예시문제 작업형2 (ver2023) 질문입니다

0

20

2

Data type에 따른 처리

0

20

2

데이터 전처리 관련

0

19

2

시험에서 문제 불러오기

0

19

2

2번문제 출력값 질문

0

27

2