🤍 전 강의 25% 할인 중 🤍

2024년 상반기를 돌아보고 하반기에도 함께 성장해요!
인프런이 준비한 25% 할인 받으러 가기 >>

  • 카테고리

    질문 & 답변
  • 세부 분야

    자격증 (데이터 사이언스)

  • 해결 여부

    해결됨

예시문제 작업형2(신 버전)

23.11.24 13:29 작성 조회수 230

0

  • 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!

  • 질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요

  • 먼저 유사한 질문이 있었는지 검색해보세요

문제 지문에서알려주는 제출 CSV 파일 형식은 0, 1, 1, 0 ... 이런 predict 결과값인데

0.11385 와 같이 predict_proba 확률값으로 결과를 제출해도 괜찮은 이유가 궁금합니다!

roc_auc가 predict_proba 로 해야한다면 predict_proba로 모형 성능테스트를 하고 제출은 predict로 해야하는 것이 아닌가... 라는 의문이 들어서 문의드립니다

 

 

답변 2

·

답변을 작성해보세요.

1

dhguseo님의 프로필

dhguseo

2023.12.01

저도 이 부분이 궁금했는데.. 그러면 문제에서의 예시 파일은 무시하고 roc_aur_score이면 predict_proba로 성능평가 및 결과 출력하고 f1_score인 경우에는 predict으로 성능평가 및 결과를 출력하면 된다는 말씀이신거죠?

네 회귀에서도 예측한 결과가 예시 파일과 달리 소수점으로 나올거에요~

그대로 제출하면 됩니다.

예시 파일은 무시는 아니고 형태는 참고해서 제출합니다.

0

이진분류에서 평가지표 roc-auc는 각 예측에 대한 1이 속할 확률정보로 계산합니다. 따라서 1확률값을 제출하는 것이 맞아요!

predict_proba로 모형 성능테스트를 하고 제출은 predict로 해야하는 것이 아닌가

-> 잘못된 방식입니다. predict로 제출하려면 모델 성능평가도 predict로 평가 해야 합니다. predict으로 제출해도 roc-auc를 채점하는 것에는 문제는 없습니다. 다만 성능이 조금 떨어집니다.

 

회귀 평가 지표에서도 동일합니다.

회귀 모델 예측결과에서 소수점이 나온다고 해서 정수처리할 필요 없습니다.

채널톡 아이콘