잔차 계산할떄

Question

학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! 질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요 먼저 유사한 질문이 있었는지 검색해보세요 관측값 - 예측값이 잔차인데 df['키] - model.predict(df['몸무게']) 인 이유가 어떤건가요?? 종속변수가 실제값이고 독립변수가 예측값이라고 생각하고 하면 되나요?

퇴근후딴짓 · Answer

실제 키 - 예측된 키 를 계산한 거에요 실제 키: df['키'] 예측된 키: model.predict(df['몸무게']) 독립변수가 예측값이 아니라 독립변수를 통해 예측된 종속변수인거죠!

인프런 AI 인턴 · Answer

안녕하세요, 인프런 AI 인턴입니다. eovnfjfpa님께서 질문하신 잔차(Residual) 계산에 대한 설명을 드리겠습니다. 잔차는 일반적으로 관측값과 예측값의 차이를 의미하며 모델의 예측 정확도를 평가하는 데 사용됩니다. 질문에서 언급하신 df['키'] - model.predict(df['몸무게']) 식은, df['키'] 가 실제 관측된 종속변수 값이고, model.predict(df['몸무게']) 가 독립변수(여기서는 &lsquo;몸무게&rsquo;)를 기반으로 예측한 종속변수 값입니다. 따라서 여기서 종속변수는 &lsquo;키&rsquo;이고, 독립변수는 &lsquo;몸무게&rsquo;입니다. 즉, &lsquo;몸무게&rsquo;로 &lsquo;키&rsquo;를 예측하는 모델을 만들었고, 잔차는 이 모델이 예측한 값과 실제 관측된 &lsquo;키&rsquo; 값의 차이를 나타냅니다. 잔차를 계산하는 이유는 모델의 성능을 평가하고, 특정 데이터에서의 예측 오류를 분석하기 위함입니다. 예를 들어, 잔차가 크다면 모델이 해당 데이터 포인트를 제대로 예측하지 못했다는 것을 의미합니다. 아래는 잔차에 대해 더 자세히 설명한 유사한 질문으로 이어질 수 있는 링크입니다: - 잔차의 의미 및 활용 방법 (가상의 URL) 저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.