인프런 영문 브랜드 로고
인프런 영문 브랜드 로고

Inflearn Community Q&A

munjihey11275736's profile image
munjihey11275736

asked

[After-work activities] Big Data Analysis Engineer Practical (Work-type 1,2,3)

5th Exam, Past Exam Type (Type 2 - Hands-on)

5회 기출유형 작업2

Resolved

Written on

·

166

0

4회 기출유형 작업형 2에서는 train_test_split을 사용안했는데여기서는 왜 사용하는 걸까요?

 

train_test_split을 사용할때와 안할때가 궁금합니다

  • 원핫인코딩과 라벨인코딩 두개를 =어떨때 써야하는지도 궁금합니다

그리고 Y_tr 에 price를 넣으신 이유가 있으실까요

 

ps. 매번 친절하게 답변해주셔서 감사합니다

python머신러닝빅데이터pandas빅데이터분석기사

Answer 1

0

roadmap님의 프로필 이미지
roadmap
Instructor

train_test_split 사용 여부

필수가 아니에요~!! 모델을 평가해보고 싶다면 사용할 수 있습니다.

만약 레이블 인코딩이나 원핫인코딩을 비교하고 싶다면 사용이 필요합니다.

정말 긴급히 준비하는 사람에게는 없이 제출하라고 알려드리기도 했어요!

 

원-핫 인코딩 또는 라벨 인코딩

은 범주형 object 자료형이 있다면 반드시 사용해야 합니다.

편한 방법을 사용해주세요! 둘 다 성능을 비교해봐도 좋아요.

 

y_tr에 price가 있는 것은

train_test_split 를 사용하면서 검증데이터와 분할했을 때 들어갔어요

학습 데이터가 80%, 검정데이터가 20%으로 분리 했다면

y_tr에는 80%의 price값이 들어있습니다.

감사합니다 :)

munjihey11275736's profile image
munjihey11275736

asked

Ask a question