강의

멘토링

커뮤니티

인프런 커뮤니티 질문&답변

mongee님의 프로필 이미지
mongee

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

[작업형3] 9. 로지스틱 회귀

8번 답을 구할 때 해당 코드의 의미를 모르겠습니다

해결된 질문

작성

·

22

0

  • 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!

  • 질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요

  • 먼저 유사한 질문이 있었는지 검색해보세요

아래 코드가 9번 답 코드에 존재하는데 이 과정이 왜 있는지 몰라 문의 드립니다.

pred = (pred > 0.5).astype(int)

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

사이킷런의 로지스틱 회귀에서 예측(predict) 결과는 0과 1이 나와요

스테츠 모델즈에서 로지스틱 회귀에서 예측(predict) 결과는 확률값이 나와요. 수동으로 0과 1로 변환이 필요합니다. 보통 임계값(스레스홀드) 0.5를 기준으로 나눕니다.

0

안녕하세요, 인프런 AI 인턴입니다. mongee님께서 질문하신 코드에 대해 설명드리겠습니다.

pred = (pred > 0.5).astype(int) 코드는 머신러닝에서 예측 결과를 이진 분류 문제에 활용하는 매우 일반적인 방법입니다. 이 코드의 의미는 다음과 같습니다.

  1. 이진 분류 이해: 이 코드는 분류 문제를 해결할 때, 각 샘플에 대해 0 또는 1로 예측하기 위해 사용됩니다. pred 배열은 어떤 모델에서 출력된 값으로, 각 요소가 특정 클래스(보통 양성 클래스)를 나타내는 확률을 가진다고 가정합니다.

  2. 임계값 설정: 여기서 0.5는 흔히 사용되는 임계값(threshold)입니다. 이 값보다 크거나 같은 확률은 양성 클래스(1)로, 그렇지 않으면 음성 클래스(0)로 분류합니다. 즉, 모델의 예측 결과가 50%의 확률 이상이면 ‘1’로 간주하고, 그렇지 않으면 ‘0’으로 간주합니다.

  3. astype(int): .astype(int)는 이진 조건을 만족할 때 True(1), 그렇지 않을 때 False(0)를 반환하며, 결과를 정수형(int)으로 변환합니다. 이는 이진 분류를 위한 결과 처리의 최종 단계로 활용됩니다.

이 방법은 흔히 로지스틱 회귀나 다른 확률 기반 모델에서 예측값을 결정할 때 사용됩니다. 이렇게 변환된 결과는 주로 평가나 후속 처리를 위해 사용됩니다.

유사한 질문에 대한 답변을 통해 추가적으로 도움이 될 수 있는 링크는 다음과 같습니다:
- 예측 임계값 결정 게시물에서는 임계값 관련 이해를 높이는 내용이 담겨 있습니다. 이 게시물을 통해 이진 분류 문제에서 임계값 설정의 중요성을 확인해 보실 수 있습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

mongee님의 프로필 이미지
mongee

작성한 질문수

질문하기