inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[개정판] 파이썬 머신러닝 완벽 가이드

사용자 행동 인식 데이터를 이용한 결정 트리 실습 - 01

결정 트리 과적합

202

Moonkyung Yang

작성한 질문수 14

0

from sklearn.datasets import make_classification

import matplotlib.pyplot as plt

%matplotlib inline

plt.title("3 Class values with 2 Features Sample data creation")

# 2차원 시각화를 위해서 feature는 2개, 결정값 클래스는 3가지 유형의 classification 샘플 데이터 생성. 

X_features, y_labels = make_classification(n_features=2, n_redundant=0, n_informative=2,

                             n_classes=3, n_clusters_per_class=1,random_state=0)

# plot 형태로 2개의 feature로 2차원 좌표 시각화, 각 클래스값은 다른 색깔로 표시됨. 

plt.scatter(X_features[:, 0], X_features[:, 1], marker='o', c=y_labels, s=25, cmap='rainbow', edgecolor='k')

-------------------------------------

책 p.199에 나와있는 코드인데, 수업중에는 다루지 않아 질문 남깁니다. 

plt.scatter(X_features[:, 0], X_features[:, 1], marker='o', c=y_labels, s=25, cmap='rainbow', edgecolor='k')이 부분에서

1)  X_features[:,0]은 0에 대한 예측 확률, X_features[:, 1]은 1에 대한 예측 확률값 인가요?

앞서 배운 predict_proba() 수행시 반환되는 ndarray값과 혼동되어 질문 남깁니다. 

답변 미리 감사드립니다. 

python 머신러닝 배워볼래요? 통계

답변 1

0

권 철민

안녕하십니까,

X_features, y_labels = make_classification(n_features=2, ,,,, n_classes=3) 하게 되면 2개의 feature와 3가지 유형 레이블값을 가진 데이터셋을 만들게 됩니다.

X_features[:,0]는 첫번째 feature로 이뤄진 데이터값들, X_features[:,2]는 두번째 feature 로 이뤄진 데이터 값들 입니다.

0에 대한 예측 확률, 1에 대한 예측 확률은 model의 predict_proba(테스트 데이터셋)를 호출할때 반환값이 가지는 것입니다.

감사합니다.

안녕하세요 열심히 수강중인 학생입니다

0

58

2

정수 인덱싱

0

65

2

넘파이 오류

0

83

2

11강 numpy의 axis 축 질문 드립니다.

0

84

2

Kaggle 에서 Santander customer satisfaction data 를 다운로드 되지가 않습니다.

0

76

2

Feature importances 를 보여주는 barplot 이 그래프로 안보여져요.

0

68

2

타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.

0

73

2

타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.

0

62

2

5강 강의 오류가 있어요.

0

81

1

실무에서 LTV 관련 모델 선택 질문입니다!

0

71

2

14강 강의 듣는중에 궁금한게 있어서 질문합니다~

0

67

3

파이썬 다운그레이 후 사이킷런 재설치

0

115

2

좋은 강의 감사합니다.

0

70

2

scoring 함수 음수값

0

66

2

6번 강의에 사이킷런, 파이썬, 아나콘다 각각 버전 일치 안 시키고 진행해도 강의 따라가 지나요?

0

98

2

분류 평가 정확도 예측

0

75

2

안녕하세요. 강의 들으면서 업무에 적용하고 싶은 수강생입니다.

0

96

1

카카오톡 채널 있나요

0

104

1

혹시 강의에서 사용하시는 ppt 받을 수 있는건가요

0

187

2

pca 스케일링 관련하여 질문드립니다.

0

100

2

주피터 대신 구글 코랩

0

169

2

강의에서 사용하는 pdf or ppt자료는 따로 없는 건가요?

0

145

2

실루엣 스코어..

0

82

2

float64 null 값 처리 방법

0

99

2