inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[개정판] 파이썬 머신러닝 완벽 가이드

classification stacking 질문입니다

177

nealzs

작성한 질문수 20

0

안녕하세요, 스태킹 관련 강의를 들으면서 의문점이 생겨 질문을 남깁니다.

diagram으로 잘 설명해주셔서

전반적으로 cross validation stacking이 어떻게 쌓이고 학습하는지 이해를 한 것 같습니다.

1. 스태킹 모델의 base는 이진 분류인지가 궁금합니다. 즉 모든 알고리즘들이 0 또는 1의 결과를 내는 건가요?

multi-label classification인 경우에도 스태킹 모델을 사용 할 수 있는 건지 궁금합니다.

2. 이어서 원본 학습데이터의 feature들은 stacking 시 어떻게 되는지 궁금합니다.

[예를 들어,

(개별모델1 예측치 column, 개별모델2 예측치 column, 개별모델3 예측치 column, 개별모델4 예측치 column,)

이와 같이 4개로 stacking]

 meta model이 학습 하는 데이터의 feature(column)가 개별 모델의 원본 학습데이터의 예측치라면

원본 데이터의 feature들이 최종 결과값에 어떻게 반영되는지 이해가 잘 되지 않습니다.

meta model의 학습 데이터는 각 모델이 결과로낸 predict proba로 구성되어 있는 건가요?

아니면 0 or 1로 구성되어 있나요?

제가 궁금한 부분을 말로 표현하기가 저도 어려운데...

meta model이 학습하려는 데이터가 개별 모델의 결과값인 0 or 1의 값으로

혹은

각 feature에 따른 확률값의 데이터라면

어떻게 원본 학습 데이터의 각  feature들을 대변하는지 궁금합니다.

통계 python 머신러닝 배워볼래요?

답변 1

0

권 철민

안녕하십니까,

1. 개인적으로는 Multi-label Classification에 Stacking을 적용해본 사례는 없습니다만 (워낙 classification에 이진 분류 형태가 많아서 그렇기도 합니다만,) Multi-label Classification에 Stacking 역시 적용 가능합니다.

2. Stacking은 일반적으로 feature들을 학습한다기 보다는 예측(답)의 패턴을 학습합니다.

그러니까 공부잘하는 사람이 여러 문제들과 답을 보면서 예측하는 학습(훈련)을 한다기 보다는 여러명 공부 잘하는 사람들(즉 base model)이 써낸 답들을 보고 이들 답의 패턴을 최종적으로 (한 사람이, 즉 메타 모델) 학습하여 예측하는 방식입니다.

때문에 기존에 feature들은 이미 base model이 학습하는 답들을 만들어 내는것에 한정됩니다. (피처를 학습하지 않고 여러 경우의 답들을 학습합니다)

감사합니다.

안녕하세요 열심히 수강중인 학생입니다

0

60

2

정수 인덱싱

0

68

2

넘파이 오류

0

85

2

11강 numpy의 axis 축 질문 드립니다.

0

85

2

Kaggle 에서 Santander customer satisfaction data 를 다운로드 되지가 않습니다.

0

77

2

Feature importances 를 보여주는 barplot 이 그래프로 안보여져요.

0

70

2

타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.

0

75

2

타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.

0

64

2

5강 강의 오류가 있어요.

0

84

1

실무에서 LTV 관련 모델 선택 질문입니다!

0

72

2

14강 강의 듣는중에 궁금한게 있어서 질문합니다~

0

69

3

파이썬 다운그레이 후 사이킷런 재설치

0

117

2

좋은 강의 감사합니다.

0

72

2

scoring 함수 음수값

0

67

2

6번 강의에 사이킷런, 파이썬, 아나콘다 각각 버전 일치 안 시키고 진행해도 강의 따라가 지나요?

0

100

2

분류 평가 정확도 예측

0

76

2

안녕하세요. 강의 들으면서 업무에 적용하고 싶은 수강생입니다.

0

98

1

카카오톡 채널 있나요

0

106

1

혹시 강의에서 사용하시는 ppt 받을 수 있는건가요

0

189

2

pca 스케일링 관련하여 질문드립니다.

0

100

2

주피터 대신 구글 코랩

0

172

2

강의에서 사용하는 pdf or ppt자료는 따로 없는 건가요?

0

146

2

실루엣 스코어..

0

84

2

float64 null 값 처리 방법

0

102

2