인프런 커뮤니티 질문&답변

khandong109님의 프로필 이미지
khandong109

작성한 질문수

[핵집] 2024 빅데이터 분석기사(필기)_과목 3~4

회귀분석

회귀방정식에서의 신뢰구간 구하는법 문의드려요

작성

·

422

0

안녕하세요 1~2듣고 3~4듣고있는 수강생입니다2차 회귀방정식에서 신뢰구간을 구하고 싶습니다 혹 1차 회귀방정식에서 구하는 신뢰구간 구하는 공식과 동일할까요? 

답변 4

0

소확성님의 프로필 이미지
소확성
지식공유자

안녕하세요. 소확성입니다.
문의하신 내용에 대해 답변드립니다.

2차 회귀식에서 예측값의 변동성을 정확하게 고려하기 위해서는 최종적으로 사용하는 공식이 1차 회귀식에서 사용하는 식과 유사한 형태로 나타낼 수 있지만, 2차 회귀식의 경우 추가적인 변동성을 고려해야 하므로 공식이 조금 더 복잡해질 수 있다는 것입니다. 알려드린 공식이 이에 해당합니다.

image

답변이 학습에 도움이 되길 바라겠습니다.
감사합니다.

0

소확성님의 프로필 이미지
소확성
지식공유자

안녕하세요, 소확성입니다!!
1. 지난번에 공식을 잘 못 알려드려 정정합니다.

image수정된 부분은 아래와 같으며, 학습에 혼란을 드려 죄송합니다.

image

위 공식은 개별 예측값의 변동성을 강조하기 위한 형태입니다.

  1. 보다 일반적이고 전체적인 문맥에서 예측값의 표준오차를 계산하기 위한 공식은 아래와 같습니다.

image

  • 𝑀𝑆𝐸MSE : 평균제곱오차 (Mean Squared Error)

  • 𝑛n : 데이터 포인트의 수

  • 𝑥x : 예측하려는 독립변수 값

  • 𝑥ˉxˉ : 독립변수 𝑥x의 평균

  • 𝑆𝑥𝑥=∑𝑖=1𝑛(𝑥𝑖−𝑥ˉ)2Sxx​=∑i=1n​(xi​−xˉ)2 : 독립변수 𝑥x의 분산

  1. 만약 평균 적합식이 아닌 개별 데이터 포인트에 대한 신뢰구간을 계산하려면, 𝑆𝐸𝑦^SEy^​​에 대한 공식을 다음과 같이 조정할 수 있습니다:

image여기서 앞에 1을 추가하는 이유는 예측된 값이 전체 회귀 모델의 오차를 반영하는데, 개별 데이터 포인트의 변동성을 추가적으로 고려하기 때문입니다.

이 공식을 통해 각 데이터 포인트에 대한 표준오차를 구할 수 있으며, 이를 기반으로 신뢰구간을 계산할 수 있으며, 신뢰구간은 다음과 같이 계산됩니다:

𝑦^±𝑡𝛼/2,𝑛−3×𝑆𝐸𝑦^y^​±/2,n−3​×SEy^​​

여기서 𝑡𝛼/2,𝑛−3/2,n−3​는 t-분포의 임계값입니다. 자유도는 𝑛−3n−3입니다 (2차 회귀 모델이므로 3개의 파라미터를 추정).

처음에 드린 답변에 대해 오류가 있어 죄송하다는 말씀드리며,
앞으로 조금 더 숙고하여 답변 올리도록 하겠습니다.

감사합니다!

khandong109님의 프로필 이미지
khandong109
질문자

image

개별 데이터의 변동성을 고려하기 위해서는

그럼 최종적으로 1차회귀식에서 사용하는 이 식으로 사용하면 된다는거네요??

 

0

소확성님의 프로필 이미지
소확성
지식공유자

안녕하세요, 소확성입니다!

2차 회귀방정식에서의 신뢰구간을 구하는 공식은 1차 방정식과 유사하지만,
추정된 회귀선에서의 예측값의 표준오차를 조금 더 복잡하게 계산해야 합니다.

 

y^​±/2​ 까지만 동일하고 이후가 달라집다.

  • y^​ : 예측값

  • 𝑡𝛼/2​ : 자유도가 𝑛−2n−2일 때, 1−𝛼/21−α/2의 신뢰수준을 가지는 t-분포의 임계값

그래서 일반적으로 소프트웨어나 통계 패키지를 사용하여 계산하며, 계산에 필요한 통계적 지식이나
소프트웨어가 있으면 세부적인 공식을 사용할 수 있으며 다음과 같습니다.

image여기서,

  • 𝑀𝑆𝐸 : 평균제곱오차 (Mean Squared Error)

  • 𝑛 : 샘플의 수

  • 𝑥 : 예측하려는 값의 독립변수

  • 𝑥ˉ : 독립변수 𝑥x의 평균

  • 𝑥𝑖​ : 각 샘플의 독립변수 값

학습에 도움이 되길 바라며,
오늘도 즐거운 하루 보내세요!

감사합니다~

khandong109님의 프로필 이미지
khandong109
질문자

감사합니다.

마지막으로 질문드려봅니다.

1) 하기 이미지에서 이 두 부분이 동일한 식 2개로 보여지는데 맞나요?

 image

2) 또한, 평균적합식이 아닌지요? 개개인 DATA 식으로 가려면 1/n 앞에 "1"이 더해야 되는지 아닌지요??

 image

감사합니다.

 

0

안녕하세요, 인프런 AI 인턴입니다.

khandong109님, 회귀방정식에서의 신뢰구간에 대한 문의를 주셨군요. 제공해주신 정보와 직접적으로 관련된 내용이 없어 정확한 답변은 어렵지만, 일반적으로 1차 회귀방정식과 2차 회귀방정식의 신뢰구간을 구하는 방법은 기본 원리가 동일합니다. 다만, 2차 회귀방정식의 경우 변수의 제곱항을 포함하므로 계산 과정에서 추가 사항이 고려되어야 할 수 있습니다.

회귀분석의 신뢰구간 계산은 주어진 회귀모델의 종류(1차, 2차 등)와 상관없이, 해당 모델을 통해 예측된 값의 신뢰도를 나타내기 위해 사용됩니다. 구체적인 공식의 적용은 회귀분석의 세부 방법론(예: 최소제곱법 등)과 통계적 가정들을 기반으로 합니다.

따라서 2차 회귀방정식에서도 유사한 방법으로 신뢰구간을 구할 수 있으나, 모델의 복잡성에 따라 계산 과정에서의 차이점을 고려해야 합니다. 신뢰구간을 구하는 구체적인 방법이나 계산 예제에 관해서는 해당 분야의 전문 강의나 통계학 관련 서적을 참고하는 것도 좋은 방법입니다.

khandong109님의 프로필 이미지
khandong109
질문자

안녕하세요? 댓글 잘 봤습니다.

결론적으로 1차회귀식의 신뢰구간 공식(상기 이미지)을 2차 회귀식에 적용해도 되는 걸로 보면 되나요??

당연히 저 위의 식에 VE라던지. 자유도(ve), 평균, Sxx 당연히 다른 값으로 넣겠죠....

VE와 ve는 당연히 2차회귀식의 분산분석을 통한 값일 것이구요...

이렇게 하면 되나요??

khandong109님의 프로필 이미지
khandong109

작성한 질문수

질문하기