선생님, 질문이 있습니다.
196
작성한 질문수 72
선생님, 강의 잘 듣고 있습니다.
다름이 아니라, get_train_valid_test_set 함수에서 이해가 잘 되지 않는 부분이 있어서 질문을 드립니다.
특히 검증 데이터에 대해
train_test_split 내장함수를 사용하는 이유는 말그대로 훈련셋과 테스트셋을 나누기 위함인데
(X_train,X_test,y_train,y_test)이렇게요
그런데 왜 좌항에서는 val_images, val_oh_labels로 각각 검증셋에 대해 return값이 전달되는 것인지 이해가 되지 않습니다.
감사합니다.
def get_train_valid_test_set(train_images,train_labels,test_images,test_labels,valid_size=0.15,random_state=2021):
train_images,train_oh_labels=get_preprocessed_ohe(train_images,train_labels)
test_images,test_oh_labels=get_preprocessed_ohe(test_images,test_labels)
#검증 데이터
tr_images,val_images,tr_oh_labels,val_oh_labels = train_test_split(train_images,train_oh_labels,test_size=valid_size,random_state=2021)
return (tr_images,tr_oh_labels),(val_images,val_oh_labels),(test_images,test_oh_labels)
답변 1
0
안녕하십니까,
정확히 질문을 이해하지 못했습니다만, train_test_split()로 왜 학습과 테스트가 아닌 학습과 검증 데이터로 분리하는가를 질문하시는 거라고 간주한다면,
train_test_split()가 꼭 학습과 테스트 용도로 분리하고자 함은 아닙니다. 기본적으로 데이터를 분리하는 역할을 합니다. 따라서 데이터를 분리하고 이를 학습과 검증 데이터 세트로 할당하는데 사용하였습니다.
원하시는 답변이 아니면 다시 말씀해 주십시요.
감사합니다.
resize 질문
0
60
1
20251212 Kaggle 런타임에 scikit-learn 설치 실패 트러블 슈팅
0
86
1
Loss와 매트릭 관계
0
75
2
Boston 코랩 실습
0
170
2
배치 정규화의 이해와 적용 2 강의 질문
0
143
2
Augmentation원본에 적용해서 데이터 갯수 자체를 늘리는 행위는 의미가있나요?
0
151
2
Conv함수 안에 activation 을 넣지 않는 이유가 뭔지 궁금합니다.
0
212
2
소프트맥스 관련 질문입니다
0
214
1
강의 관련 질문입니다
0
161
2
residual block과 identity block의 차이
0
199
2
옵티마이저와 경사하강법의 차이가 궁금합니다.
1
251
1
실습 환경
0
171
2
입력 이미지 크기
0
256
2
데이터 증강
0
203
2
albumentations ShiftScaleRotate
0
210
1
Model Input Size 관련
0
292
1
마지막에 bird -> frog 말고도 deer -> frog 도 잘못된것 아닌가요??
0
206
1
일반적인 질문 (kaggle notebook사용)
0
276
2
실무에서 Augmentation 적용 시
0
346
2
안녕하세요 교수님
0
235
1
가중치 초기화(Weight Initialization) 질문입니다.
0
332
1
테스트 데이터셋 predict의 'NoneType' object has no attribute 'shape' 오류
0
412
1
학습이 이상하게 됩니다.
2
1040
2
boston import가 안됩니다
0
230
1





