랜덤포레스트 선형성
277
작성한 질문수 51
안녕하세요. 강의 잘 듣고 있습니다.
다름이 아니라 랜덤포레스트에 대해 궁금한
점이 있습니다.
Q1
로지스틱회귀나 선형회귀모델의 경우 선형성을 전제로 한 모델이기때문에 피처 인코딩 시 원핫인코딩을 해준다고 하셨는데요. 랜덤포레스트 모델의 경우 선형성에 영향을 안 받나요? 랜덤포레스트의 경우 라벨인코딩을 적용해도 아무 문제가 없는 것 같아서요.
Q2
그리고 여기서 말하는 선형성이라는 게 간단하게 어떤 것을 말하는 것일까요? 입력변수에 대해 출력변수가 선형적으로 비례할 수 있음을 의미하는 것일까요?
답변 부탁드립니다.
감사합니다.
답변 1
1
안녕하십니까,
선형 모델들은 피처들의 값 크기 자체에 모델이 영향을 받을 수가 있습니다(선형 회귀식을 생각해 보시면 됩니다) 그래서 Scaling등의 작업을 수행하고 원핫 인코딩도 마찬가지 이유로 수행을 합니다. 하지만 랜덤 포레스트와 같은 트리 기반 모델들은 피처들의 값 자체에 영향을 받지 않습니다. 그래서 원핫 인코딩을 적용하지 않아도 무방합니다.
선형성은 개념 자체는 좀 더 복잡할 수는 있지만, 간단하게 보자면, 머신러닝 모델이 특정 선형식에 기반하여 만들어졌을 때 가지는 특성 정도록 생각해 주시면 될 것 같습니다.
선형 회귀 모델은 피처값과 회귀 계수로 1차 다항식과 같이 구성되지만, 반드시 1차 다항식 같은 식만 선형 회귀로 부르지 않고, 다양한 방식으로 선형 모델과 같이 처리가 가능한 모델을 선형 모델이라고 합니다. 예를 들어 다항회귀나 로지스틱 회귀도 선형 회귀에 속합니다.
또한 서포트 벡터 머신도 선형식에 기반하여 데이터 세트를 분류해 내기 때문에 선형 모델에 속할 수 있습니다(물론 커널 트릭을 사용한 비선형 분류도 가능합니다)
그래서 이런 선형식을 사용한 모델의 일반적인 특성을 제가 통칭해서 선형성이라고 한것 입니다.
감사합니다.
모델 서빙과 관련된 강좌가 출시되는지 질문드립니다.
0
30
2
안녕하세요 열심히 수강중인 학생입니다
0
71
2
정수 인덱싱
0
75
2
넘파이 오류
0
94
2
11강 numpy의 axis 축 질문 드립니다.
0
91
2
Kaggle 에서 Santander customer satisfaction data 를 다운로드 되지가 않습니다.
0
83
2
Feature importances 를 보여주는 barplot 이 그래프로 안보여져요.
0
71
2
타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.
0
78
2
타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.
0
65
2
5강 강의 오류가 있어요.
0
86
1
실무에서 LTV 관련 모델 선택 질문입니다!
0
74
2
14강 강의 듣는중에 궁금한게 있어서 질문합니다~
0
70
3
파이썬 다운그레이 후 사이킷런 재설치
0
122
2
좋은 강의 감사합니다.
0
76
2
scoring 함수 음수값
0
68
2
6번 강의에 사이킷런, 파이썬, 아나콘다 각각 버전 일치 안 시키고 진행해도 강의 따라가 지나요?
0
104
2
분류 평가 정확도 예측
0
83
2
안녕하세요. 강의 들으면서 업무에 적용하고 싶은 수강생입니다.
0
100
1
카카오톡 채널 있나요
0
111
1
혹시 강의에서 사용하시는 ppt 받을 수 있는건가요
0
191
2
pca 스케일링 관련하여 질문드립니다.
0
104
2
주피터 대신 구글 코랩
0
176
2
강의에서 사용하는 pdf or ppt자료는 따로 없는 건가요?
0
149
2
실루엣 스코어..
0
88
2





