예시문제 작업형2(신 버전)
490
작성자 없음
投稿した質問数 0
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!
질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요
먼저 유사한 질문이 있었는지 검색해보세요
문제 지문에서알려주는 제출 CSV 파일 형식은 0, 1, 1, 0 ... 이런 predict 결과값인데
0.11385 와 같이 predict_proba 확률값으로 결과를 제출해도 괜찮은 이유가 궁금합니다!
roc_auc가 predict_proba 로 해야한다면 predict_proba로 모형 성능테스트를 하고 제출은 predict로 해야하는 것이 아닌가... 라는 의문이 들어서 문의드립니다
回答 2
1
저도 이 부분이 궁금했는데.. 그러면 문제에서의 예시 파일은 무시하고 roc_aur_score이면 predict_proba로 성능평가 및 결과 출력하고 f1_score인 경우에는 predict으로 성능평가 및 결과를 출력하면 된다는 말씀이신거죠?
0
이진분류에서 평가지표 roc-auc는 각 예측에 대한 1이 속할 확률정보로 계산합니다. 따라서 1확률값을 제출하는 것이 맞아요!
predict_proba로 모형 성능테스트를 하고 제출은 predict로 해야하는 것이 아닌가
-> 잘못된 방식입니다. predict로 제출하려면 모델 성능평가도 predict로 평가 해야 합니다. predict으로 제출해도 roc-auc를 채점하는 것에는 문제는 없습니다. 다만 성능이 조금 떨어집니다.
회귀 평가 지표에서도 동일합니다.
회귀 모델 예측결과에서 소수점이 나온다고 해서 정수처리할 필요 없습니다.
기출 11회 작업형 2_전체 데이터 학습 여부
0
3
1
예측값 결과 소수점 차이
0
15
2
기출 문제와 실전챌린지 연습문제 무엇부터 푸는게 나은가요?
0
13
0
전처리 train() test([ ])
0
12
2
작업형 1 배경지식 질문
0
16
2
옳게 풀은건지 질문드립니다!
0
12
1
roc_auc_score
0
22
2
추가질문 합니다
0
13
2
시험환경 구름
0
16
2
2유형 질문드려요
0
13
2
RandomForest vs lgb
0
22
2
전처리 관련질문
0
21
3
작업형3 기출
0
15
2
유형2에서 데이터분할 생략 가능여부
0
27
2
9회 기출 유형3 질문
0
16
2
lgb 기초편
0
12
1
괄호 사용
0
20
2
작업형 2 데이터 전처리 질문
0
20
1
11회 기출 유형 작업형1 문제 3-1
0
17
1
예시문제 작업형2 (ver2023) 질문입니다
0
19
2
Data type에 따른 처리
0
18
2
데이터 전처리 관련
0
17
2
시험에서 문제 불러오기
0
18
2
2번문제 출력값 질문
0
25
2

