inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[개정판] 파이썬 머신러닝 완벽 가이드

분류 실습 1 : 캐글경연대회의 산탄데르 은행 고객 만족 예측 - 01

ROC_AUC_Score 과정에서 오류

2047

김남욱

작성한 질문수 63

0

안녕하세요 강사님.

캐글 예제 진행 중 ROC-AUC 스코어 오류가 생겨서 질문드립니다.

우선 진행 과정에서 train.csv 파일을 split해 X, y_train과 X, y_valid로 나누었고

eval_set로 X, y_valid를 사용하였으며 

test.csv 파일은 X_test, sample_submission.cvs 파일은 y_test 로 사용하여 진행했습니다.

(실제 컴피티션에서는 이렇게 진행하는 것인가 하여 이렇게 진행해봤는데 방법이 맞는지는 모르겠습니다. 이 부분도 맞는 지 답변해주시면 감사하겠습니다)

XGBoost.fit을 통해 학습 후 X_test에 predict 한 뒤 ROC-AUC 스코어를 구하는 과정에서

Only one class present in y_true. ROC AUC score is not defined in that case.

라는 에러가 계속 발생합니다ㅠㅠ

y_test 데이터를 value_counts로 확인하니 레이블값이 0으로만 차있던데 이것이 오류의 이유인가 싶습니다.

만약 이게 원인이라면 y_test가 하나의 값으로만 차있으면 ROC 스코어를 구할 수 없는 것인가요?

머신러닝 배워볼래요? 통계 python

답변 1

0

권 철민

안녕하십니까, 

말씀하신대로 y_test가 모두 동일한 값으로 되어 있기 때문으로 생각됩니다.  해당 경우에는 위 에러가 발생합니다.  y_test값을 다시 확인해 보시기 바랍니다. 

감사합니다. 

0

김남욱

답변 감사드립니다.

그렇다면 만약에 실제로 y_test이 동일한 레이블값으로만 구성되어 있으면 ROC스코어 사용이 불가능하고 다른 평가지표를 사용하는 것이 맞는 것인가요??

0

권 철민

네, 해당 경우에 ROC 는 적용할 수가 없습니다. 

모델 서빙과 관련된 강좌가 출시되는지 질문드립니다.

0

50

2

안녕하세요 열심히 수강중인 학생입니다

0

86

2

정수 인덱싱

0

86

2

넘파이 오류

0

108

2

11강 numpy의 axis 축 질문 드립니다.

0

106

2

Kaggle 에서 Santander customer satisfaction data 를 다운로드 되지가 않습니다.

0

93

2

Feature importances 를 보여주는 barplot 이 그래프로 안보여져요.

0

76

2

타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.

0

83

2

타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.

0

73

2

5강 강의 오류가 있어요.

0

90

1

실무에서 LTV 관련 모델 선택 질문입니다!

0

81

2

14강 강의 듣는중에 궁금한게 있어서 질문합니다~

0

75

3

파이썬 다운그레이 후 사이킷런 재설치

0

128

2

좋은 강의 감사합니다.

0

79

2

scoring 함수 음수값

0

72

2

6번 강의에 사이킷런, 파이썬, 아나콘다 각각 버전 일치 안 시키고 진행해도 강의 따라가 지나요?

0

108

2

분류 평가 정확도 예측

0

87

2

안녕하세요. 강의 들으면서 업무에 적용하고 싶은 수강생입니다.

0

114

1

카카오톡 채널 있나요

0

118

1

혹시 강의에서 사용하시는 ppt 받을 수 있는건가요

0

193

2

pca 스케일링 관련하여 질문드립니다.

0

109

2

주피터 대신 구글 코랩

0

184

2

강의에서 사용하는 pdf or ppt자료는 따로 없는 건가요?

0

155

2

실루엣 스코어..

0

91

2