강의

멘토링

로드맵

Inflearn brand logo image

인프런 커뮤니티 질문&답변

dnrwls9115님의 프로필 이미지
dnrwls9115

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

다중선형회귀2 (범주형 변수)

모델에서의 상수항 처리

해결된 질문

작성

·

37

0

model.summary()하면 회귀 계수들이 나오는데

회귀 계수 관하여 답을 제출할때는 상수항은 고려하지 않고 제하나요?

 

이질문을 드리는 이유는 기출8회 작업형3 문제와 캐글 문제 때문에 여쭈어봅니다

  1. 기출8회 작업형3처럼 상수항은'독립변수'에 포함시키지 않는지

  2. 이에따라 항상 상수항은 연산에대해서 포함시키지않는것인지

  3. 하단 캐글 문제 처럼 회귀계수 중 가장 큰값 같은 문제에서 상수항 계수가 제일 큰데 이러면 상수항 회귀계수를 내는것인지

 

image.png

 

 

 

# 모든 변수를 사용하여 OLS 모델을 적합하고, 회귀계수 중 가장 큰 값은?

from statsmodels.formula.api import ols

formula =  'y~x1+x2+x3+x4'

model = ols(formula, data = data).fit()

print(model.summary())
print(model.params[1:].max()
image.png

 

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

1,2,3 포함해 답변드리면

상수항(절편) 포함여부는 시험 문제에서 명확하지 않게 출제되었다가 시험중 팝업을 띄운 케이스가 있기에

기출에서 나온다면 포함여부를 명확하게 안내할 것으로 예상됩니다.

 

0

안녕하세요, 인프런 AI 인턴입니다.

dnrwls9115님께서 질문해주신 모델에서의 상수항 처리에 대해 설명드리겠습니다. 회귀 분석에서 상수항(intercept)은 중요한 역할을 하지만, 문제에 따라 포함 여부가 달라질 수 있습니다.

  1. 상수항이 독립변수로 포함되는지 여부: 일반적으로 회귀분석에서 상수항은 각각의 독립 변수의 회귀계수와 함께 모델링 과정에 포함됩니다. 하지만, 문제에서 독립변수로 물을 때에는 상수항을 독립변수로 포함하지 않습니다. 상수항은 모델의 절편 값을 나타내며, 독립 변수 자체는 아닙니다. 따라서, 회귀계수들이 각 독립 변수에 대한 영향을 설명하고자 할 때는 상수항을 제외합니다.

  2. 상수항 연산 포함 여부: 모델링 및 분석 결과를 해석할 때 상수항의 포함 여부는 분석 목적에 따라 달라질 수 있습니다. 기본적으로 결과 해석 시에는 상수항을 포함시키지 않지만, 필요에 따라 상수항을 포함하여 전체 모델을 설명하는데 활용될 수 있습니다.

  3. 회귀계수 문제에서의 상수항 포함: 주어진 문제에서 “회귀계수 중 가장 큰 값”을 찾는 경우 상수항도 회귀계수의 하나로 간주될 수 있습니다. 그렇기 때문에, 상수항을 고려하여 가장 큰 회귀계수를 선택할 때는 상수항도 포함하는 것이 일반적입니다.

각 회귀 문제의 요구 사항을 살펴볼 때 이러한 점을 염두에 두시면 도움이 될 것입니다. 특정 문제에서 상수항의 포함 여부가 모호할 경우, 문제 설명을 더 자세히 확인하시거나, 지식공유자 또는 작성자의 답변을 참고하시기 바랍니다.

질문하신 유형과 관련된 정보 및 유사한 질문을 참고하시기 좋을 포럼 게시물:
- 기울기와 절편 관련: 상수항과 회귀계수를 다루는 방법에 대한 설명이 있습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

dnrwls9115님의 프로필 이미지
dnrwls9115

작성한 질문수

질문하기