인프런 영문 브랜드 로고
인프런 영문 브랜드 로고

인프런 커뮤니티 질문&답변

뭐임뭐임님의 프로필 이미지
뭐임뭐임

작성한 질문수

[개정판] 파이썬 머신러닝 완벽 가이드

보팅 알고리즘이 다루는 데이터셋 정의에 대한 질문입니다.

해결된 질문

작성

·

256

0

안녕하세요. 강의와 교재를 잘 보고 있는 학생입니다.

교재 207p에서 보팅방식에 대한 이미지 설명이 있는데  그림 상으로는 원본 데이터셋 "전체"를 여러 분류기가 예측해보는 걸로 이해되는 그림인 것 같습니다. 

그런데 209p 에서의 하드보팅 설명 그림에는 트레이닝 데이터셋에 샘플 데이터 1,2,3,4라고 표기되어

원본 데이터 "전체"를 여러분류기가 학습하는 게 아니라 각 분류기마다 원본데이터를 나눠 할당한 것처럼 표기되어

약간 헷갈리는 상황입니다.

이를 이해하기 위한 조언을 부탁드립니다.

감사합니다.

답변 1

1

권 철민님의 프로필 이미지
권 철민
지식공유자

안녕하십니까,

지적하신 부분이 이해의 혼동을 충분히 불러 일으킬 수 있겠군요. 잘 아시다시피 보팅은 동일한 학습 데이터를 여러 분류기가 학습하는 방식입니다.  209 페이지의 경우는 sample data1, sample data2는 서로 다른 데이터를 샘플링한다는 의미보다는 원본 데이터를 각각 학습한다는 의미로 표시가 되어야 하는데, 이해에 혼동을 드린것 같습니다.

209페이지는 추후 책 3판 출간 시 정정하도록 하겠습니다.

감사합니다.

뭐임뭐임님의 프로필 이미지
뭐임뭐임

작성한 질문수

질문하기