인프런 커뮤니티 질문&답변

gogopall님의 프로필 이미지
gogopall

작성한 질문수

파이썬을 활용한 머신러닝 딥러닝 입문

실습 - K-Nearest Nighbors 모델 실습 - 붓꽃 데이터 분류

셔플 시, target과 데이터가 섞일 때

작성

·

406

·

수정됨

0

제가 강의를 들으며 사이킷런에 iris 샘플을 가지고 data와 target을 나누고 있는 와중에 문득 궁금한 점이 생겼습니다.

train_test_split을 통해 train셋과 test셋을 나누게 되는데 shuffle이 True로 되어 있기 때문에 자동적으로 shuffle이 수행되지않습니까? 이 때 샘플데이터와 타겟은 짝을 지어서 셔플이 되는 건가요? 아니면 샘플데이터도 타겟 데이터도 둘 다 아무렇게나 섞이는 건가요?

답변 2

0

gogopall님의 프로필 이미지
gogopall
질문자

아 그렇군요 감사합니다!

0

YoungJea Oh님의 프로필 이미지
YoungJea Oh
지식공유자

이해하고 계시는 것이 맞습니다. 당연히 짝을 지어서 shuffle 이 되어야 하고 train_test_split은 data 와 target을 서로의 짝을 유지한 채로 shuffle 합니다. 다른 궁금한 사항 있으면 알려주세요. 감사합니다.

gogopall님의 프로필 이미지
gogopall

작성한 질문수

질문하기