인프런 커뮤니티 질문&답변
Random Forest의 정의
작성
·
389
0
안녕하세요, 멋있는 강의 잘 듣고있습니다.
Random Forest를 설명해주셨는데, 여러 가진 개념의 집합체로 보여 질문을 드립니다.
제가 파악한 정의는 다음과 같습니다
* 여러개의 분류기를 통해 학습하고 학습한 결과를 종합(평균 또는 최빈값)하여 최종 결과값을 결정한다
* 이때, 랜덤 포레스트를 운용하는 방법은 두 가지 이다.
* * 서로 다른 분류기로 동일한 데이터셋에 대해 다른 결과를 얻는다
* * 서로 다른 데이터로 동일한 분류기에 대해 다른 결과를 얻는다
* * 또는, 이 둘을 둘 다 운용한다.
제가 정리한 이 내용이 맞을까요?
퀴즈
랜덤 포레스트 알고리즘의 핵심 아이디어는 무엇일까요?
단일 결정 트리의 성능을 극대화
여러 개의 선형 회귀 모델을 결합
여러 개의 결정 트리를 결합하여 예측
데이터 차원을 축소하여 모델 학습
답변 1
1
안녕하세요~. 반갑습니다. 위에 말씀해주신 개념에서 랜덤포레스트는
* * 서로 다른 데이터로 동일한 분류기에 대해 다른 결과를 얻는다
형태입니다. (분류기는 무조건 decision tree입니다.)
말씀해주신 개념은 앙상블 러닝의 개념이며
* 앙상블 러닝은 여러개의 분류기를 통해 학습하고 학습한 결과를 종합(평균 또는 최빈값)하여 최종 결과값을 결정한다
* 이때, 앙상블 러닝을 운용하는 방법은 두 가지 이다.
* * 서로 다른 분류기로 동일한 데이터셋에 대해 다른 결과를 얻는다
* * 서로 다른 데이터로 동일한 분류기에 대해 다른 결과를 얻는다
* * 또는, 이 둘을 둘 다 운용한다.
위와 같이 생각하시면 되겠습니다~.
감사합니다~.





명쾌한 답변 정말 감사합니다!!