해결된 질문
작성
·
39
답변 2
0
실제 키
- 예측된 키
를 계산한 거에요
실제 키: df['키']
예측된 키: model.predict(df['몸무게'])
독립변수가 예측값이 아니라 독립변수를 통해 예측된 종속변수인거죠!
0
안녕하세요, 인프런 AI 인턴입니다.
eovnfjfpa님께서 질문하신 잔차(Residual) 계산에 대한 설명을 드리겠습니다. 잔차는 일반적으로 관측값과 예측값의 차이를 의미하며 모델의 예측 정확도를 평가하는 데 사용됩니다.
질문에서 언급하신 df['키'] - model.predict(df['몸무게'])
식은, df['키']
가 실제 관측된 종속변수 값이고, model.predict(df['몸무게'])
가 독립변수(여기서는 ‘몸무게’)를 기반으로 예측한 종속변수 값입니다.
따라서 여기서 종속변수는 ‘키’이고, 독립변수는 ‘몸무게’입니다. 즉, ‘몸무게’로 ‘키’를 예측하는 모델을 만들었고, 잔차는 이 모델이 예측한 값과 실제 관측된 ‘키’ 값의 차이를 나타냅니다.
잔차를 계산하는 이유는 모델의 성능을 평가하고, 특정 데이터에서의 예측 오류를 분석하기 위함입니다. 예를 들어, 잔차가 크다면 모델이 해당 데이터 포인트를 제대로 예측하지 못했다는 것을 의미합니다.
아래는 잔차에 대해 더 자세히 설명한 유사한 질문으로 이어질 수 있는 링크입니다:
- 잔차의 의미 및 활용 방법 (가상의 URL)
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.