인프런 커뮤니티 질문&답변
pipelin pred_proba 부분에 대한 질문
작성
·
405
0
안녕하세요, 좋은 강의 감사합니다.
이 부분에서 하이라이트 친 predict_probal의 부분중 [:,1]로 슬라이싱을 해주셨는데요, predict_proba의 결과로 나오는 행렬의 각 열이 의미하는 바가 궁금합니다. 왜 두번째 열만 사용하시는 건가요?
퀴즈
텍스트 분석은 비정형 텍스트 데이터에서 모델을 만들고 인사이트를 얻는 데 중점을 둡니다. 그럼 자연어 처리(NLP)의 주요 목표는 무엇일까요?
대규모 데이터베이스를 구축하는 것
인간의 언어를 컴퓨터가 이해하고 해석하는 것
이미지 데이터를 분석하여 패턴을 찾는 것
수치형 데이터의 통계적 특성을 파악하는 것
답변 1
0
권 철민
지식공유자
안녕하십니까,
predict_proba()는 0이 될 확률, 1일 될 확률 두개를 값으로 나타냅니다.
그러니까 예측 데이터가 5개라면 predict_proba()는 아래와 같이 5x2 배열 값을 반환합니다.
[
[0.3, 0.7],
[0.1, 0.9],
[0.8, 0.2],
[0.7, 0.3]
[0,9, 0.1]
]
첫번째 열은 0이 될 확률, 두번째 열은 1이 될 확률인데 roc auc 를 위해서는 1이 될 확률만 가지면 됩니다.
감사합니다.





