강의

멘토링

커뮤니티

Inflearn コミュニティ Q&A

uksun129322 のプロフィール画像
uksun129322

投稿した質問数

ビッグデータ分析記事手書きオールインワン:3週間で終わる完璧な準備

最適回帰方程式選択

최적회귀방정식 선택 관련 내용 중

作成

·

21

·

編集済み

0

AIC가 가장 적은 수의 설명변수를 포함시켜야 한다고 이해했는데, 해당 강의(127강) 마지막에 예시로 보여주신 자료에서 Length, wheelbase 값의 AIC가 가장 작은것을 모두 제거하였습니다..

그리고 나머지 변수로 최종 회귀식을 도출했구요,

AIC가 작은(적은?)값이 포함된 변수가 최종 회귀식의 설명변수로 포함되어야 한다고 이해했는데, 개념 이해가 잘못된 부분 설명 부탁드립니다..

통계빅데이터인공지능(ai)빅데이터분석기사

回答 2

0

uksun129322님의 프로필 이미지
uksun129322
質問者

네 설명 감사합니다. 잘 이해하였습니다!

0

Masocampus님의 프로필 이미지
Masocampus
インストラクター

안녕하세요, 마소캠퍼스입니다.

 

개념 이해하신 부분과 같이 변수를 포함시켜 가는 방식은 같은 영상의 조금 앞부분에서 설명하는 전진 선택법에 해당하며,
반대로 해당 문제에서 사용하는 방법은 모든 변수를 가진 채로 시작해
영향이 적은 변수부터 제거하는 후진 선택으로 진행되었습니다.

R에서 step() 함수를 사용했을 때의 해석 방법을 추가로 안내드립니다.

 

image.png

우선 변수를 제외하기 전의 상황으로, AIC는 355.69가 됩니다.
이 단계에서 AIC 열 밑의 값은 각 변수를 제외했을때의 결과 AIC이며,
Length를 제외했을 때의 AIC가 353.80이 되므로
이 단계에서는 Length를 제외하는 것이 합리적인 선택이 됩니다.

image.png

2단계에서는 wheelbase를 뺐을 때의 AIC가 352.18로 가장 낮게 되므로,
해당 변수를 제외하게 되며, 이후 단계에서는 변수 제외를 통해 AIC가 낮아지는 선택지가 없게 되므로
최종 변수는 EngineSize, Weight, RPM이 남게 됩니다.

해당 상태를 반영한 것이 최종 회귀식이 된다 이해하시면 될 것 같습니다.

감사합니다.

 

마소캠퍼스 드림.

 

uksun129322 のプロフィール画像
uksun129322

投稿した質問数

質問する