inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

예시문제 작업형2(ver. 2023)

예시문제 작업형2(신 버전)

해결된 질문

489

작성자 없음

작성한 질문수 0

0

문제 지문에서알려주는 제출 CSV 파일 형식은 0, 1, 1, 0 ... 이런 predict 결과값인데

0.11385 와 같이 predict_proba 확률값으로 결과를 제출해도 괜찮은 이유가 궁금합니다!

roc_auc가 predict_proba 로 해야한다면 predict_proba로 모형 성능테스트를 하고 제출은 predict로 해야하는 것이 아닌가... 라는 의문이 들어서 문의드립니다

 

 

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 2

1

dhguseo

저도 이 부분이 궁금했는데.. 그러면 문제에서의 예시 파일은 무시하고 roc_aur_score이면 predict_proba로 성능평가 및 결과 출력하고 f1_score인 경우에는 predict으로 성능평가 및 결과를 출력하면 된다는 말씀이신거죠?

0

퇴근후딴짓

네 회귀에서도 예측한 결과가 예시 파일과 달리 소수점으로 나올거에요~

그대로 제출하면 됩니다.

예시 파일은 무시는 아니고 형태는 참고해서 제출합니다.

0

퇴근후딴짓

이진분류에서 평가지표 roc-auc는 각 예측에 대한 1이 속할 확률정보로 계산합니다. 따라서 1확률값을 제출하는 것이 맞아요!

predict_proba로 모형 성능테스트를 하고 제출은 predict로 해야하는 것이 아닌가

-> 잘못된 방식입니다. predict로 제출하려면 모델 성능평가도 predict로 평가 해야 합니다. predict으로 제출해도 roc-auc를 채점하는 것에는 문제는 없습니다. 다만 성능이 조금 떨어집니다.

 

회귀 평가 지표에서도 동일합니다.

회귀 모델 예측결과에서 소수점이 나온다고 해서 정수처리할 필요 없습니다.

대응표본검정 레빈

0

14

2

단일표본검정 문제 유형

0

16

2

[작업형 3] 6~7. 카이제곱 검정

0

15

2

9회 작업형3 문제 1-1

0

19

2

최종답안 계산 방식 질문

0

14

1

시험 치기 전 급하게 질문 사항

0

24

2

유형3

0

23

2

작업형 2 연습문제 섹션 3

0

18

2

11 기출문제 ipynb파일

0

21

2

작업형 3 유형

0

22

2

11회 기출 유형(작업형1) 2번 정답

0

18

2

f1 score 질문

0

19

2

10회 작업형 2 인코딩 질의

0

16

2

53번 강의에서 갑자기 수업노트가 없어졌습니다.

0

21

2

28:19 roc_auc이유

0

20

2

수강연장문의

0

23

2

전체적인 머신러닝 순서

0

24

2

빅분기 실기 유형2질문

0

26

1

ID 전처리 이유

0

33

2

데이터제공

0

33

2

예시문제 작업형3 꼬리질문2번

0

22

1

데이터 개수를 구할 때, len과 value_counts 차이

0

29

2

작업형 2 제출방

0

22

2

인코딩 스케일링 순서

0

24

2