인프런 커뮤니티 질문&답변
pipelin pred_proba 부분에 대한 질문
작성
·
398
0
안녕하세요, 좋은 강의 감사합니다.
이 부분에서 하이라이트 친 predict_probal의 부분중 [:,1]로 슬라이싱을 해주셨는데요, predict_proba의 결과로 나오는 행렬의 각 열이 의미하는 바가 궁금합니다. 왜 두번째 열만 사용하시는 건가요?
답변 1
0
권 철민
지식공유자
안녕하십니까,
predict_proba()는 0이 될 확률, 1일 될 확률 두개를 값으로 나타냅니다.
그러니까 예측 데이터가 5개라면 predict_proba()는 아래와 같이 5x2 배열 값을 반환합니다.
[
[0.3, 0.7],
[0.1, 0.9],
[0.8, 0.2],
[0.7, 0.3]
[0,9, 0.1]
]
첫번째 열은 0이 될 확률, 두번째 열은 1이 될 확률인데 roc auc 를 위해서는 1이 될 확률만 가지면 됩니다.
감사합니다.





