• 카테고리

    질문 & 답변
  • 세부 분야

    딥러닝 · 머신러닝

  • 해결 여부

    미해결

CV세트 기반 스태킹 관련 질문

21.03.25 19:00 작성 조회수 167

0

책과 강의에서는 개별모델이 학습 폴드로 학습하여 테스트 세트를 예측한 결과값들을 평균을 낸다고 나와있습니다.

조금 의문이 드는 것이 메타모델이 학습할 때에는 이진분류의 경우, 0과 1로만 이루어진 패턴을 학습하는 반면, 테스트 데이터셋을 예측할 땐 0과 1 사이의 유리수가 들어올 수 있는데 이 경우, 예측이 잘되는지 궁금합니다.

예를 들어, 이진분류에서 cv=3인 경우, 개별 분류기가 세번에 걸쳐 테스트 데이터 세트의 1행을 1,0,1로 예측했다면 이를 평균하면 0.66입니다. 학습은 0과1로 이루어진 반면, 테스트에서는 0.66처럼 소수점이 포함되어도 아무런 문제가 없는건지 궁금합니다!

답변 1

답변을 작성해보세요.

0

안녕하십니까,

네 맞습니다.  평균값 0.66으로 되어 있어도 테스트 시에 아무 문제가 없습니다.  프로그램 자체는 0, 1 모두 숫자이기에 평균값 0.66과 같은 소수점이 포함되어도 문제가 없습니다.

다만 어떻게 이런 생각을 했는지는 모르지만 0과 1로 되는 원본 데이터 세트를 메타에서느는 평균값으로 예측한 다는 개념자체는 예상을 깨는 발상 같습니다.

감사합니다.