inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[개정판] 파이썬 머신러닝 완벽 가이드

분류(Classification) Summary

안녕하세요 선생님 질문입니다!

434

Alex

작성한 질문수 69

0

선생님 안녕하세요 알고리즘을 공부하고 다시 들으니 이해가 더 잘 되는 것 같습니다.

이제 막 분류에 대한 마지막까지 들었는데 제가 이해한 부분이 맞는지 모르겠습니다.

  1. 결정트리는 머신러닝의 한 방법이다.

  2. 정확도를 높이기 위해서 앙상블 기법(여러가지 머신러닝을 섞거나, 데이터를 부트스트래핑 등)을 쓴다.

  3. 대표적인 앙상블 기법으로는 배깅과 보팅, 부스팅이 있는데, 배깅에서는 여러가지 결정트리로 되어있는 랜덤포레스트 방식, 보팅은 서로 다른 머신러닝들로 학습하는 것, 부스팅은 약한 분류기를 순차적으로 학습하면서 전에 학습했던 특정데이터에 가중치를 두어 점차적으로 학습하는 방식

  4. 스태킹은 분류된 데이터를 가지고 다시 한번 하나의 머신러닝 기법으로 학습한다. (하지만 학습에 테스트데이터를 쓰기때문에 오버피팅이 발생)

이 정도로 머릿속으로 정리를 했는데 틀린 것이 있는지, 또는 보팅을 할때 다른 머신러닝 여러개와 결정트리 여러개 로 구성된 앙상블 모델도 랜덤포레스트라고 부를 수 있는지가 궁금합니다

python 머신러닝 통계 앙상블 배깅 랜덤포레스트

답변 1

0

권 철민

안녕하십니까,

정리하신게 대부분 맞습니다.

  1. 결정트리는 머신러닝의 한 방법이다.

    => 맞습니다.

     

  2. 정확도를 높이기 위해서 앙상블 기법(여러가지 머신러닝을 섞거나, 데이터를 부트스트래핑 등)을 쓴다.

    => 정확히는 모델 성능을 위해 사용합니다. ^^

     

  3. 대표적인 앙상블 기법으로는 배깅과 보팅, 부스팅이 있는데, 배깅에서는 여러가지 결정트리로 되어있는 랜덤포레스트 방식, 보팅은 서로 다른 머신러닝들로 학습하는 것, 부스팅은 약한 분류기를 순차적으로 학습하면서 전에 학습했던 특정데이터에 가중치를 두어 점차적으로 학습하는 방식

    => 배깅은 여러개의 결정트리들을 기반으로 모델을 학습하되, 학습 데이터를 각자의 결정트리가 배깅 방식으로 샘플링해서(부트 스트래핑 분할) 학습합니다. 대표적으로 랜덤 포레스트가 배깅 방식입니다. 보팅과 부스팅은 말씀하신 게 맞습니다.

     

  4. 스태킹은 분류된 데이터를 가지고 다시 한번 하나의 머신러닝 기법으로 학습한다. (하지만 학습에 테스트데이터를 쓰기때문에 오버피팅이 발생)

    => 스태킹은 일차 개별 모델들이 분류로 예측된 결과 데이터를 다시 학습 데이터로 만들어서 예측합니다. 그러니까 개별 모델들이 예측한 데이터를 스태킹 형태로 합쳐서 최종 모델이 다시 이를 학습하고 예측합니다. 학습에 테스트 데이터를 사용하지는 않습니다.

    단점으로는 일차 개별 모델들이 예측한 결과로 테스트 데이터를 만들어서 이를 기반으로 최종 예측하므로 실시간으로 들어오는 데이터에 대해서는 바로 적용하기가 어렵습니다. 주로 배치성 데이터에 대해 예측 모델을 만들때 좀 더 성능향상을 위해서 사용됩니다.

감사합니다.

 

0

Alex

감사합니다! 오늘도 좋은 하루 되시길 바랍니다!

모델 서빙과 관련된 강좌가 출시되는지 질문드립니다.

0

29

2

안녕하세요 열심히 수강중인 학생입니다

0

71

2

정수 인덱싱

0

72

2

넘파이 오류

0

89

2

11강 numpy의 axis 축 질문 드립니다.

0

89

2

Kaggle 에서 Santander customer satisfaction data 를 다운로드 되지가 않습니다.

0

82

2

Feature importances 를 보여주는 barplot 이 그래프로 안보여져요.

0

71

2

타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.

0

78

2

타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.

0

65

2

5강 강의 오류가 있어요.

0

86

1

실무에서 LTV 관련 모델 선택 질문입니다!

0

74

2

14강 강의 듣는중에 궁금한게 있어서 질문합니다~

0

70

3

파이썬 다운그레이 후 사이킷런 재설치

0

122

2

좋은 강의 감사합니다.

0

76

2

scoring 함수 음수값

0

68

2

6번 강의에 사이킷런, 파이썬, 아나콘다 각각 버전 일치 안 시키고 진행해도 강의 따라가 지나요?

0

104

2

분류 평가 정확도 예측

0

82

2

안녕하세요. 강의 들으면서 업무에 적용하고 싶은 수강생입니다.

0

100

1

카카오톡 채널 있나요

0

111

1

혹시 강의에서 사용하시는 ppt 받을 수 있는건가요

0

191

2

pca 스케일링 관련하여 질문드립니다.

0

102

2

주피터 대신 구글 코랩

0

175

2

강의에서 사용하는 pdf or ppt자료는 따로 없는 건가요?

0

149

2

실루엣 스코어..

0

87

2