• 카테고리

    질문 & 답변
  • 세부 분야

    컴퓨터 비전

  • 해결 여부

    미해결

선생님, 질문이 있습니다.

21.11.15 23:06 작성 조회수 110

0

선생님, 강의 잘 듣고 있습니다. 

다름이 아니라, get_train_valid_test_set 함수에서 이해가 잘 되지 않는 부분이 있어서 질문을 드립니다. 

특히 검증 데이터에 대해 

train_test_split 내장함수를 사용하는 이유는 말그대로 훈련셋과 테스트셋을 나누기 위함인데 

(X_train,X_test,y_train,y_test)이렇게요
그런데 왜 좌항에서는 val_images, val_oh_labels로 각각 검증셋에 대해 return값이 전달되는 것인지 이해가 되지 않습니다.

 

감사합니다.

def get_train_valid_test_set(train_images,train_labels,test_images,test_labels,valid_size=0.15,random_state=2021):

    train_images,train_oh_labels=get_preprocessed_ohe(train_images,train_labels)
    test_images,test_oh_labels=get_preprocessed_ohe(test_images,test_labels)


    #검증 데이터

    tr_images,val_images,tr_oh_labels,val_oh_labels = train_test_split(train_images,train_oh_labels,test_size=valid_size,random_state=2021)
    return (tr_images,tr_oh_labels),(val_images,val_oh_labels),(test_images,test_oh_labels)

답변 1

답변을 작성해보세요.

0

안녕하십니까, 

정확히 질문을 이해하지 못했습니다만, train_test_split()로 왜 학습과 테스트가 아닌 학습과 검증 데이터로 분리하는가를 질문하시는 거라고 간주한다면,

train_test_split()가 꼭 학습과 테스트 용도로 분리하고자 함은 아닙니다. 기본적으로 데이터를 분리하는 역할을 합니다.  따라서 데이터를 분리하고 이를 학습과 검증 데이터 세트로 할당하는데 사용하였습니다. 

원하시는 답변이 아니면 다시 말씀해 주십시요. 

감사합니다.