inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[개정판] 파이썬 머신러닝 완벽 가이드

XGBoost를 이용한 위스콘신 유방암 예측(파이썬 Native XGBoost 사용)

load_breast_cancer() 데이터

238

freedom07

작성한 질문수 104

0

선생님~ 3:32-35쯤에 

1이 악성이고 0이 그냥 양성이라고 하셨는데요~

3:39에 

print(dataset.target_names) 해보면

['malignant', 'benign'] 으로 나오면서 

다시, 0이 malignant(악성), 1이 benign (양성)이라고 하시는데..

0이 악성이고, 1이 양성이 맞는건가요~?

(처음에 말씀하신 부분이 잘못 말씀하신건지요~?) 

 그리고 또 궁금한점이..

0이 악성이고, 1이 양성이게 되면..

보통 이진분류에서 중요한 값을 positive에 넣어서 1값이 중요한 값으로 처리한다고 설명하셨었는데..

기존 sklearn에 내장되어있는 위스콘신유방암 데이터에서는 0을 악성으로 햇네요..

악성이 더 중요한 값이 아닌가요~? (양성이면 정상이라는 거니깐.. )

저 데이터에서는 데이터 입력자가 그렇게 넣었겠지만.. 

보통 암진단 경우에서는 중요한 값인 악성을 1로 하지요..?? 

머신러닝 배워볼래요? 통계 python

답변 1

0

권 철민

확인 결과 load_breast_cancer()는 데이터 자체가 malignant가 0 , benign이 1이군요.

일반적으론 제가 말씀드린 대로 검출하고자 하는 중요한 부분을 1로 합니다. 악성 검출이 업무적으로 중요하면 malignant가 1 로 보통 설정합니다. 

하지만 load_breast_cancer()는 데이터 자체가 malignant가 0으로 입력 되어 있습니다.

안녕하세요 열심히 수강중인 학생입니다

0

59

2

정수 인덱싱

0

67

2

넘파이 오류

0

83

2

11강 numpy의 axis 축 질문 드립니다.

0

84

2

Kaggle 에서 Santander customer satisfaction data 를 다운로드 되지가 않습니다.

0

76

2

Feature importances 를 보여주는 barplot 이 그래프로 안보여져요.

0

68

2

타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.

0

74

2

타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.

0

62

2

5강 강의 오류가 있어요.

0

82

1

실무에서 LTV 관련 모델 선택 질문입니다!

0

71

2

14강 강의 듣는중에 궁금한게 있어서 질문합니다~

0

68

3

파이썬 다운그레이 후 사이킷런 재설치

0

115

2

좋은 강의 감사합니다.

0

71

2

scoring 함수 음수값

0

66

2

6번 강의에 사이킷런, 파이썬, 아나콘다 각각 버전 일치 안 시키고 진행해도 강의 따라가 지나요?

0

98

2

분류 평가 정확도 예측

0

75

2

안녕하세요. 강의 들으면서 업무에 적용하고 싶은 수강생입니다.

0

97

1

카카오톡 채널 있나요

0

105

1

혹시 강의에서 사용하시는 ppt 받을 수 있는건가요

0

187

2

pca 스케일링 관련하여 질문드립니다.

0

100

2

주피터 대신 구글 코랩

0

170

2

강의에서 사용하는 pdf or ppt자료는 따로 없는 건가요?

0

145

2

실루엣 스코어..

0

83

2

float64 null 값 처리 방법

0

101

2