inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[리뉴얼] 처음하는 파이썬 머신러닝 부트캠프 (쉽게! 실제 캐글 문제 풀며 정리하기) [데이터분석/과학 Part2]

Voting 이해하고, 최종 예측해서, Kaggle 에 제출해보기 (업데이트)

Voting 이해하고, 최종 예측해서, Kaggle 에 제출해보기 질문

203

문환룡

작성한 질문수 20

0

Voting 이해하고, 최종 예측해서, Kaggle 에 제출해보기
3분 31초에서 설명하는 voting Classifier가
강의자료 10_CLASSIFICATION_MODEL_UNDERSTAND.pdf에 있는
Bagging 기법중 Random Forest에서 사용하는 Aggregation(Voting) 과 같은 방법인 건가요

pandas python kaggle 머신러닝 배워볼래요?

답변 1

0

잔재미코딩 DaveLee

안녕하세요. 큰 틀에서는 유사함이 큽니다.

다만, 데이터를 쪼개서, 각 데이터로 머신러닝 결과를 내고, 이를 정의한 룰에 따라 합쳐서, 기존보다 더 좋은 성능을 내는 것이 bagging 기법의 기본 컨셉이고요. 이를 기반으로 만들어진 머신러닝 기법중 하나가 randomforest 이고요. randomforest 내부에서 일종의 aggregation 을 한 것입니다.

voting 도 결국 각 머신러닝 결과를 정의한 룰에 따라, 합쳐서 기존보다 더 좋은 성능을 내는 것은 맞는데요. 정확하게 보면, 데이터를 쪼개서, 동일한 머신러닝 알고리즘으로 낸 결과를 합친 것은 아니고, 전체 데이터에 대해, 다양한 머신러닝 알고리즘의 결과를 기반으로, 최종 결과는 내는 것이라서 살짝은 다른 느낌이라고 보시면 좋을 것 같습니다.

그러니까, 사람으로 치면, bagging 은 한 사람 내부에서 결론을 내기 위한, 일종의 사고 방식인 셈일 수 있고, voting 은 한 사람 내부의 사고 방식 단위라기보다는,  각 사람 단위로, 기본적으로는 여러 사람들의 의견을 취합하는 방법을 의미한다고 보시면 좋을 것 같습니다.

 

자료 공유 질문

0

70

1

Ascii 에러 관련하여 질문드립니다

0

96

1

고차원 데이터 질문

0

82

1

세션4 범주형 데이터 분석 패턴 강의 질문

0

215

2

pandas 2.2.2, xgboost 2.1.3 에러 해결 방법

0

227

1

sklearn v1.5.1

0

175

1

머신러닝 적용을 위한 Feature Engineering 작업1

0

181

2

missingno 대체

0

172

1

scikit-learn 1.5.1 matplotlib 3.9.2

0

134

1

환불문의

0

271

1

자료공유를 받으려고 하는데 에러가 납니다.

0

165

1

iplot에서 항상 에러나는 분 안계신가용?

0

232

1

사망 여부 영향 가능성

0

147

1

섹션4_인코딩 이해하고 적용해보기(원핫인코딩) 질문

0

194

1

df.corr(numeric_only=True).iplot() 에러 해결 어떻게 해야되나요?

0

286

1

주피터 노트북 201_REGRESSION_BIKE_SHARING_MODELS 중 질문

0

251

1

3강 강의 자료 코드 관련 질문입니다

1

343

1

맥 사용자 mkdir .kaggle 했는데 파일이 안만들어집니다.

0

421

1

Bayesian Optimization에서 optimizer.maximize()함수를 더이상 지원 안한다고 합니다.

0

884

2

Bayesian Optimization LightGBM 적용

0

462

2

하이퍼 파라미터 튜닝 기법 적용하기 실행값이 미묘하게 달라요.

1

347

1

중복된 코드 수정 요청 - 자전거 공유 문제 이해와 EDA3

0

217

1

강의 중 에러 질문

0

748

1

cross_val_score 에러

0

467

1