훈련-개발 세트 문의

Question

훈련-개발 세트는 예시를 들면 모바일 환경에서 얼굴을 인식하는 분류기를 만든다고 할 때, 데이터를 확보하기 위해 구글에 올라온 고해상도 이미지를 크롤링하여 고화질의 이미지를 얻지만 실제로는 다양한 해상도의 이미지로 사용될 때 성능이 안좋다면 과대적합인지 데이터 불일치인지 모르기 때문에 훈련-개발세트를 두는 것이고 이는 검증셋과는 별개이므로 이 때에는 훈련, 훈련-개발, 검증, 테스트로 나누는 방법으로 이해했는데 맞게 이해한 것일까요? ( 데이터를 훈련, 검증, 테스트로 나누는 것으로 인지했습니다. 그 중 훈련 데이터는 오로지 학습을 위해 사용되는 것이고 검증 셋은 하이퍼 파라미터 조정이나 여러 모델 중 가장 우수한 모델을 선택할 때 사용하는 것, 테스트 데이터는 머신러닝의 최종 성능 평가할 목적으로 사용되는 것으로 이해했습니다. ) 질문이 장황해 죄송합니다.

박해선 · Answer

안녕하세요. 박해선입니다. 해상도를 포함해 여러가지 이유로 인한 데이터 불일치에 해당하는지 판단하기 위해서입니다. 감사합니다.