안녕하십니까 선생님
622
작성한 질문수 1
다항 회귀에 와서 약간 어려움을 겪고있어서 처음 질문을 드립니다.
단일회귀가 선으로 회귀면, 다중 회귀는 평면으로 이해했습니다.
1. 피쳐가 한개인 데이터가 비선형적으로 나온 경우 polynomialFeatures를 통해 피쳐를 임의로 늘려준다고 배웠습니다. 그렇다면 다항회귀도 결국 피쳐가 늘어난 다중회귀라고 생각되는데, 그럼 degree를 엄청 높이면 공간상에 저희가 알수 없는 고차원의 것으로 회귀된다고 보면 되나요?
2. 다항회귀를 통해 회귀된 고차원의 것이 있다면, 그것을 x1 피쳐 단면에 의해서만 보이게 짤랐기 때문에 아래 사진처럼 2차원으로 관찰 할수 있다고 보면 될까요?
답변 2
1
안녕하십니까,
단일 회귀든, 다중 회귀든 다 선으로 이해하시는게 더 도움이 될 것 같습니다.
선형 회귀는 feature가 몇개로 구성되던 (몇 차원 공간이던지) 이들 feature 상에 분포되어 있는 데이트들을 관통하는(잘 설명하는) 일반적인 선형식을 찾아내는 것입니다. 그래서 선형회귀는 x1w1 + x2w2 + x3w3와 같은 개별 feature들과 개별 회귀 계수의 선형 결합으로 구성되어 있습니다.
그런데 모든 데이터들을 이렇게 피처들과 회귀 계수의 선형적인 결합으로는 설명할 수가 없는 경우들이 있습니다. 그렇다고 선형 회귀의 특성인 회귀계수의 선형 결합을 깨뜨릴수는 없어서, Polynomial features 같은 방법이 나왔습니다. 즉 피처들을 추가적으로 만들되 기존 feature들을 다항식형태로 새롭게 만들어서 선형식에 비선형적인 효과를 줄수 있도록 만드는 것입니다.
1. 피쳐가 한개인 데이터가 비선형적으로 나온 경우 polynomialFeatures를 통해 피쳐를 임의로 늘려준다고 배웠습니다. 그렇다면 다항회귀도 결국 피쳐가 늘어난 다중회귀라고 생각되는데, 그럼 degree를 엄청 높이면 공간상에 저희가 알수 없는 고차원의 것으로 회귀된다고 보면 되나요?
=> 알수 없는 고차원의 것으로 회귀된다는 의미를 정확히 이해하지는 못했습니다만,,,,
일단 degree를 엄청 높이시면 안됩니다. overfitting되서 성능이 엄청 떨어집니다. 기존 데이터에 약간의 비선형적인 성질(feature)만 추가하자는 것이 다항 회귀의 목표 입니다. 근데 질문의 의도가 수학의 고차원과 물리학의 공간을 의미하신다면, 저도 뭐라 답해야 할지 잘 모르겠지만, 너무 추상적(고차원적)으로 생각하지 않으셨으면 좋겠습니다.
그리고 2번 질문도 1번 질문과 연관되어서 정확히 뭐라 답변을 드리기가 어렵지만, 아뭏튼, feature들은 1개든, 다차원(여러개의 feature들)인 환경에서 단일 회귀, 다중 회귀 모두 선으로 개념을 생각해 주시고, 다항 회귀는 곡선적인 개념으로 생각해 주시면 좋을 것 같습니다. 선형 회귀는 다차원 공간(feature)상에 있는 데이터 분포를 관통하는 선(또는 곡선)을 찾는 것이라고 개념적으로 생각해 주시면 좋을 것 같습니다.
감사합니다.
감사합니다.
0
제가 너무 수학적으로 생각한거 같습니다. 고차원적이라고 말씀드렸던게 만약 다중회귀로 피쳐가 두개면 평면, 피쳐가 3개면 공간(?), 피쳐가 많아지면 알수 없는 무언가(??) 로 회귀가 된다고 생각을 했습니다.
근데 다항회귀에서 degree를 높인다는게 결국 피쳐가 많아지는 다중 회귀라고 생각을 했었어서.. 후에 나오는 degree가 높을시 overfitting 되는 경우도 피쳐가 여러개일때 공간에 알수없는 무언가가 그려지면 그때 x1 관점에서만 보기에 구불구불한 곡선이 나오는가?.. 궁금했었습니다
그냥 말씀 해주신데로 조금더 간단하게 생각해보겠습니다. 감사합니다~
모델 서빙과 관련된 강좌가 출시되는지 질문드립니다.
0
52
2
안녕하세요 열심히 수강중인 학생입니다
0
90
2
정수 인덱싱
0
86
2
넘파이 오류
0
109
2
11강 numpy의 axis 축 질문 드립니다.
0
107
2
Kaggle 에서 Santander customer satisfaction data 를 다운로드 되지가 않습니다.
0
94
2
Feature importances 를 보여주는 barplot 이 그래프로 안보여져요.
0
77
2
타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.
0
83
2
타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.
0
73
2
5강 강의 오류가 있어요.
0
90
1
실무에서 LTV 관련 모델 선택 질문입니다!
0
81
2
14강 강의 듣는중에 궁금한게 있어서 질문합니다~
0
76
3
파이썬 다운그레이 후 사이킷런 재설치
0
129
2
좋은 강의 감사합니다.
0
80
2
scoring 함수 음수값
0
72
2
6번 강의에 사이킷런, 파이썬, 아나콘다 각각 버전 일치 안 시키고 진행해도 강의 따라가 지나요?
0
108
2
분류 평가 정확도 예측
0
87
2
안녕하세요. 강의 들으면서 업무에 적용하고 싶은 수강생입니다.
0
114
1
카카오톡 채널 있나요
0
118
1
혹시 강의에서 사용하시는 ppt 받을 수 있는건가요
0
193
2
pca 스케일링 관련하여 질문드립니다.
0
109
2
주피터 대신 구글 코랩
0
184
2
강의에서 사용하는 pdf or ppt자료는 따로 없는 건가요?
0
156
2
실루엣 스코어..
0
91
2





