선형회기 모델 r2 계산방법
196
작성한 질문수 1
안녕하세요
선형회기모델 강의 내용 중 12:42분 ppt에서 Sum of squared residual이 SS_res로 되어있는데, 이 용어에 대한설명이 관측값과 회기 예측값의 차이로 으로 되어있습니다.
그렇다면 이는 SSE(error sum of squares)와 동일한 것으로 수식이 (SS-res / SS_tot),
즉 SSE/SST 로 변경되어야 하지 않을까요?
(SS_res와 SSE를 동일한 뜻으로 간주한다면)
하지만 현재 자료는 1- (SS_res/SST)로 되어있고, 이 케이스는 SS_res가 회기값과 관측값 평균의 차, 즉 regression sum of squares 와 동일한 의미로 설명되어 있습니다.
아마 SSR(SS_res)의 용어와 SSR(regression sum of squares)의 용어 혼돈인것 같은데 작성하신 뜻에 의하면 "1-"부분이 삭제되어야 할것 같아서 문의 남깁니다.
확인부탁드립니다.
답변 1
0
안녕하세요 Cindy Jeon님,
SS_res (Sum of Squared Residuals) as the sum of the squared differences between the actual target values (the observed values) and the predicted target values (the values predicted by the model)이 부분을 말씀하시는 거 같은데 제가 혹시나해서 찾아봤는데, 맞는 내용입니다만...
한글로 하면, 실제 타겟 값(관측된 값)과 모델이 예측한 타겟 값(모델의 예측 값) 사이의 차이의 제곱합을 의미합니다. 이 수치는 모델이 실제 데이터와 얼마나 잘 맞는지를 나타내며, SS_res 값이 작을수록 모델의 예측이 실제 데이터와 더 가까움을 나타내어, 더 좋은 모델 적합도를 의미합니다.
만약 1이 빠진 수식이라면 그것은 직접 SSE/SST를 나타내는 비율을 의미하는데, 이는 R²의 정의와 맞지 않으므로 1이 포함되어야 합니다
그리고 SSR은

맞지 않는 자료 같습니다만...
인터넷에 보시면 자료가 많은데, 제가 하나 가져와 봤습니다.
https://pub.towardsai.net/regression-metrics-6690815bb51f
괄호 사용
0
2
1
작업형 2 데이터 전처리 질문
0
5
0
11회 기출 유형 작업형1 문제 3-1
0
5
0
7회 3유형 2번문제 질문
0
4
1
예시문제 작업형2 (ver2023) 질문입니다
0
8
1
Data type에 따른 처리
0
5
1
데이터 전처리 관련
0
12
2
시험에서 문제 불러오기
0
11
2
2번문제 출력값 질문
0
15
2
pd.get_dummies()가 bool로 반환
0
16
2
대응표본검정 레빈
0
18
3
단일표본검정 문제 유형
0
18
2
[작업형 3] 6~7. 카이제곱 검정
0
16
2
9회 작업형3 문제 1-1
0
29
2
최종답안 계산 방식 질문
0
18
1
시험 치기 전 급하게 질문 사항
0
30
2
유형3
0
28
2
작업형 2 연습문제 섹션 3
0
19
2
11 기출문제 ipynb파일
0
32
2
작업형 3 유형
0
26
2
11회 기출 유형(작업형1) 2번 정답
0
27
2
f1 score 질문
0
21
2
10회 작업형 2 인코딩 질의
0
19
2
53번 강의에서 갑자기 수업노트가 없어졌습니다.
0
26
2





