• 카테고리

    질문 & 답변
  • 세부 분야

    데이터 분석

  • 해결 여부

    해결됨

성능확인 질문

22.11.23 15:07 작성 조회수 125

0

 

질문.png기출 3회 강의 성능을 확인하는 부분에서

answer을 읽어와서 사용하셨는데 실제 시험환경에서는 홀드아웃을 통해 y_test를 만들어서 확인해야하는지, 아니면 어떻게 확인해야 하는지 궁금합니다

답변 1

답변을 작성해보세요.

0

DQ K님의 프로필

DQ K

지식공유자

2022.11.23

안녕하세요, wjsgns745님!
질문주셔서 감사합니다.

질문주신 부분의 코드는 실제 시험환경에서는 존재하지 않는 '정답' 데이터입니다.
또한 기본적으로 강의에서 제안하는 '실압코'에서는 Holdout과 같은 과정이 생략되어 있는데요,
그 이유는 이렇습니다.

1 ) Holdout을 뺌으로써 split, validation&tuning cycle 생략
2) 더 적은 코드를 외워도 됨으로써 긴장되는 시험환경에서 보다 쉽게 적용

다만 Holdout을 진행하지 않음으로서 제가 제안드린 풀이방법이 실제로 성능이 어떻게 되는지 궁금하거나, 성능이 충분하지 않을까봐 불안하실 수 있습니다.
이러한 이유로 위와 같이 성능을 증명하는 코드를 추가한 것입니다.

만약 다소의 여유가 있어 holdout과 ensemble 등의 과정을 적용하고 싶으시다면,
시험 환경에서 제시되는 train data를 split해 학습용과 평가용 데이터로 나눈 뒤(Holdout),
학습용 데이터에 대해 학습시킨 뒤 평가 데이터셋을 통해 제시된 평가지표로 평가해보며,
성능이 좋은 모델을 선택하고, 앙상블의 비율을 바꿀 수 있습니다.

하지만 그동안의 시험 경향과 제한된 환경으로 인해 굳이 시험환경에서는 홀드아웃이나 별도의 튜닝없이 실압코만 잘 적용해도 충분히 만점을 받으실 수 있으니, 이를 중심으로 작업1유형에 더 집중하시는 것을 추천드립니다.

감사합니다.