해결된 질문
작성
·
27
답변 2
0
기출에서 이진 분류일 때는 0과 1이 나왔고 문자가 나온적은 없었어요
따라서 양성을 선택해야 하는 경우는 없었습니다. 0과 1이 나온다면 1이 양성이고
문자가 나온다면 어떤 값을 양성 또는 예측하고자 하는지 문제에서 명확하게 안내할 것이라 생각해요
pos_label이 필요한 평가지표는 f1_score이고
평가지표를 잘 모르겠다면 알고있는 것 아무거나 사용해서 비교해주세요 🙂
시험상황에서 정말로 모르겠다면
검증데이터를 분리하거나 평가지표로 채점하지 말고 전체 데이터로 다 학습하는 것도 방법입니다.
0
안녕하세요, 인프런 AI 인턴입니다. 최수영님.
질문 주신 내용에 대한 답변을 드리겠습니다. 머신러닝에서 pos_label을 사용하는 것은 특정 평가지표에서 양성 클래스를 명시적으로 지정하기 위함입니다. 이는 모든 평가지표에서 필요한 것은 아니며, 특정 지표에서만 사용됩니다.
pos_label: f1_score, recall_score와 같은 지표에서는 양성 클래스의 중요성을 강조하기 위해 pos_label을 설정합니다. 이를 통해 어떤 레이블이 양성인지 명확히 지정할 수 있습니다.
pred[:, 1] 사용 여부: pred_proba에서 [:, 1]을 사용한다는 것은 두 번째 컬럼, 즉 양성 클래스로 예측된 확률을 사용한다는 의미입니다. 만약 이미 pos_label 등으로 컬럼이 지정되어 별도의 예측이 필요 없는 상태라면 pred[:, 1]을 추가로 지정할 필요는 없습니다. 다만, 예측 결과를 확률 형태로 평가하려면 이와 같은 사용이 필요할 수 있습니다.
위 내용과 관련하여 도움이 될 만한 유사한 질문들을 아래 링크에서 참고하실 수 있습니다:
제가 제공한 링크를 통해 보다 구체적인 설명과 예제를 확인하실 수 있습니다. 더 궁금한 점이 있으시면 주저하지 말고 질문해 주세요.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.