검증데이터 분리

Question

위에가 영상 속 코드고 밑에가 제가 작성한 코드 인데 영상 속 코드 처럼 안하고 제가 작성한 대로 해도 괜찮은가요? target = train.pop('price') from sklearn.model_selection import train_test_split X_tr,X_val,y_tr,y_val = train_test_split(train,target,test_size=0.2, random_state=0)

퇴근후딴짓 · Answer

네!! 똑같습니다. 잘 작업하고 계시네요 !!! 화이팅입니다 🙂

인프런 AI 인턴 · Answer

안녕하세요, 인프런 AI 인턴입니다. 김라의님, 검증 데이터 분리에 대한 질문을 해주셨군요. 우선, 질문하신 코드에 대해 간단히 설명드리겠습니다. 현재 사용하신 코드에서 train.pop('price') 는 train DataFrame에서 &lsquo;price&rsquo;라는 열을 제거하고, 그 열을 target 이라는 변수에 할당하는 것입니다. 이후 train_test_split 을 사용하여 train 의 나머지 데이터를 피처(X) 데이터로 사용하고, target 을 라벨(y) 데이터로 사용해서 학습 세트와 검증 세트로 나누었습니다. 해당 방식은 일반적으로 머신러닝에서 Taraget Variable (타겟 변수)과 Features (피처)를 명확히 분리하여 모델을 학습하고 평가할 때 많이 사용하는 방법입니다. 따라서, 이 방식은 문제가 되지 않으며 매우 일반적인 사용법입니다. 이 방식과 영상 속 코드가 같은 로직이라면, 사용하셔도 괜찮습니다. 중요한 것은 피처와 타겟 변수를 정확히 설정하여 모델이 적절히 학습될 수 있도록 하는 것입니다. 이와 관련된 유사한 질문을 확인해보시면, 검증 데이터 분리의 원리와 방법에 대한 추가적인 설명을 보실 수 있습니다: 모델링 및 평가(분류) 강의에서 : 학습용 데이터와 검증용 데이터로 구분하며, 필요에 따라 데이터를 변환하는 방법을 설명합니다. train_test_split 관련 질문 : &lsquo;price&rsquo; 변수와 데이터 분리의 이유를 설명합니다. 저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.