강의

멘토링

커뮤니티

인프런 커뮤니티 질문&답변

Yoonseok Choi님의 프로필 이미지
Yoonseok Choi

작성한 질문수

[개정판] 파이썬 머신러닝 완벽 가이드

회귀 실습 2: 캐글경연 주택가격 예측 - Advanced Regression Techniques - 02

coefficient 해석

작성

·

317

0

책 367p를 보면 GrLiveArea 피처의 회귀계수가 가장 크고 주택 가격에 미치는 영향이 당연히 높을 것이라고 하셨습니다. 

그런데 회귀계수의 절대값만 보면 Lasso에서는 RoofMatl_ClyTile이 훨씬 높은데, 그럼 주택 가격에 영향을 가장 많이 미치는 요인은 이 피처 아닌가요?

예측값이 각 인풋과 회귀계수들을 곱한 것의 합으로 알고있는데, 그렇다면 절대값이 가장 큰 RoofMatl_ClyTile라고 생각되고 상식적으로 GrLivArea가 가장 중요한 요소일거 같기도 하고 어떻게 해석해야할지 모르겠습니다 ㅜ

답변 1

0

권 철민님의 프로필 이미지
권 철민
지식공유자

안녕하십니까,

회귀 계수가 크다고 회귀 결과값에 미치는 영향도가 반드시 높은 피처라고 보기는 어렵지만,  대략적으로 어느정도 관계가 높다고 볼수는 있습니다.  개별 독립 변수들의 값의 스케일이 서로 다르므로(즉 값이 1000 단위가 있고, 1 단위도 있을 수 있습니다), 사전에 스케일링이 되지 않은 경우 회귀 계수의 값 역시 이에 따라 달라 질 수 있습니다.

하지만 전반적으로는 회귀 계수가 크면 회귀 결과값에 미치는 영향도가 높습니다.

RoofMatl_ClyTile의 경우도 - 로 회귀 계수값이 상당히 큰 편인데, 뒷장에서 보시면 이상치 제거를 하면서 RoofMatl_ClyTile의 회귀 계수가 감소한것을 아실 수 있습니다.

감사합니다.

Yoonseok Choi님의 프로필 이미지
Yoonseok Choi

작성한 질문수

질문하기