강의

멘토링

로드맵

Inflearn brand logo image

인프런 커뮤니티 질문&답변

최수영님의 프로필 이미지
최수영

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

머신러닝 학습 및 평가(분류)

pos_label 사용 여부

해결된 질문

작성

·

27

0

pred 컬럼 명이 0또는1이 아니라 문자일 때 컬럼을 선택해주기 위해서 pos_label을 사용해준다고 하셨는데 모든 평가지표에서 pos_label을 사용해야 하는지와 pos_label을 써서 컬럼을 선택해줬는데, 실제 값을 예측할 때 {'pred':pred[:,1]}을 해주는게 맞는지 궁금합니다 이미 한 컬럼이 선택됐는데 범위를 지정할 경우 이상이 없을까요?

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

기출에서 이진 분류일 때는 0과 1이 나왔고 문자가 나온적은 없었어요

따라서 양성을 선택해야 하는 경우는 없었습니다. 0과 1이 나온다면 1이 양성이고

문자가 나온다면 어떤 값을 양성 또는 예측하고자 하는지 문제에서 명확하게 안내할 것이라 생각해요

 

pos_label이 필요한 평가지표는 f1_score이고

평가지표를 잘 모르겠다면 알고있는 것 아무거나 사용해서 비교해주세요 🙂

시험상황에서 정말로 모르겠다면

검증데이터를 분리하거나 평가지표로 채점하지 말고 전체 데이터로 다 학습하는 것도 방법입니다.

0

안녕하세요, 인프런 AI 인턴입니다. 최수영님.

질문 주신 내용에 대한 답변을 드리겠습니다. 머신러닝에서 pos_label을 사용하는 것은 특정 평가지표에서 양성 클래스를 명시적으로 지정하기 위함입니다. 이는 모든 평가지표에서 필요한 것은 아니며, 특정 지표에서만 사용됩니다.

  1. pos_label: f1_score, recall_score와 같은 지표에서는 양성 클래스의 중요성을 강조하기 위해 pos_label을 설정합니다. 이를 통해 어떤 레이블이 양성인지 명확히 지정할 수 있습니다.

  2. pred[:, 1] 사용 여부: pred_proba에서 [:, 1]을 사용한다는 것은 두 번째 컬럼, 즉 양성 클래스로 예측된 확률을 사용한다는 의미입니다. 만약 이미 pos_label 등으로 컬럼이 지정되어 별도의 예측이 필요 없는 상태라면 pred[:, 1]을 추가로 지정할 필요는 없습니다. 다만, 예측 결과를 확률 형태로 평가하려면 이와 같은 사용이 필요할 수 있습니다.

위 내용과 관련하여 도움이 될 만한 유사한 질문들을 아래 링크에서 참고하실 수 있습니다:

제가 제공한 링크를 통해 보다 구체적인 설명과 예제를 확인하실 수 있습니다. 더 궁금한 점이 있으시면 주저하지 말고 질문해 주세요.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

최수영님의 프로필 이미지
최수영

작성한 질문수

질문하기