inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

캐글 Advanced 머신러닝 실전 박치기

학습완료후 나의 .csv 파일을 캐글에 submission 했을때 평가에 대한 질문.

374

David Amumu

작성한 질문수 1

0

안녕하세요.

현재 캐글 Home Credit Default Risk 시작하기 섹션 부분 수강 중입니다

캐글에 submission을 할때 'SK_ID_CURR' 과 '내가 산출해낸 1이될 확률값' 만을 

CSV 파일로 만들어서 제출을 합니다. 

그런데 이 정보만 가지고 캐글에서 어떻게 test 데이터에 대한 auc값을 산출해내는지 궁금합니다. 

제 모델(코드)를 제출해야 해당 모델에  test데이터를 넣어서 auc값을 산출해낼수있는것 아닌지요? 

캐글에서 어떻게 저렇게 할수있는지 궁금합니다.

kaggle 머신러닝 배워볼래요?

답변 1

0

권 철민

안녕하십니까,

사이킷런에서 roc auc를 계산하는 roc_auc_score()함수는 인자로 y_true 값과 예측 확률값을 입력 받습니다.

sklearn.metrics.roc_auc_score(y_true, y_score, *, average='macro', sample_weight=None, max_fpr=None, multi_class='raise', labels=None)[source]

여기서 y_true는 실제 class값이므로 kaggle 내부적으로 가지고 있을 것이고, , y_score 예측 확률값이므로 이러한 식으로 roc auc 를 계산하는 걸로 보입니다.

감사합니다.

0

David Amumu

빠른 답변 정말 감사합니다!!

sql사용

0

44

2

좋은 강의 감사드립니다.

0

73

2

8분 40초경 LGBClassifier에서 설정해주신 파라미터들 관련 질문

0

246

2

사용 가능한 RAM을 모두 사용한 후 세션이 다운되었습니다

0

597

1

안녕하세요 선생님

0

228

1

권철민교수님 진심으로 감사드립니다.

0

319

1

안녕하세요 선생님

0

351

1

# credit_card_balance 데이터셋 피쳐엔지니어링

0

267

1

초거대 데이터셋을 Submission하려면?

0

190

1

Library 관련 질문

0

350

3

최적화 함수 에러

0

587

4

LightGBM Iteration관련

0

422

2

안녕하세요 교수님 vm 관련해서 질문이 있습니다.

0

203

1

코드를 실행했는데 오류가 발생합니다

0

1981

2

bayes_opt 회귀 모델에 적용하려면..

0

267

1

타겟값의 로그변환에 대해서

0

779

1

아나콘다 환경설정

0

459

1

깃허브 주소 문의드립니다.

0

358

1

손실함수에 대한 질문

0

342

1

card_bal 데이터셋 시각화 관련 질문입니다

0

230

1

LGBM null값 처리에 관해 질문있습니다

0

536

1

컬럼 관련 질문

0

278

1

히스토그램 x 값

0

362

1

n_iter 횟수 넘음 질문

0

484

2