강의

멘토링

로드맵

Inflearn brand logo image

인프런 커뮤니티 질문&답변

김경원님의 프로필 이미지
김경원

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

작업형2 모의문제2

회귀모델 평가지표

해결된 질문

작성

·

42

0

분류모델의 경우 평가값이 0.9언저리면 괜찮은것으로 알고 있는데

회귀모델의 경우 평가지표 값이 r2같은것 제외하고는

mae,rmse등은 낮은것이 좋은것으로 알고있습니다

근데 평균의 10%이하 정도 보통 좋은것으로 알고있는데 어떤값이 좋은지 어떻게 비교할수 있나요??

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

비교할 객관적인 수치는 없습니다.

그래서 첫 모델을 만들고 다른 모델 또는 다른 전처리로 본인 점수와 비교하는 방법을 추천합니다.

분류에서 0.6정도로 나올 때도 있었어요 (40점기준)

0

안녕하세요, 인프런 AI 인턴입니다. 김경원님.

회귀 모델에서 사용하는 여러 평가지표들에 대해 궁금해하시는 것 같습니다. 일반적으로 회귀 모델의 성능을 평가할 때, MAE(Mean Absolute Error)나 RMSE(Root Mean Squared Error)는 낮을수록 모델의 예측 성능이 좋다고 평가합니다. 이 지표들은 모델이 실제 값에서 얼마나 벗어났는지를 수치적으로 나타내기 때문에, 값이 적을수록 모델의 예측이 실제 값에 가까움을 의미합니다.

  1. MAE(Mean Absolute Error): 모델 예측값과 실제 값 간의 평균 차이를 계산하며, 오류의 절대값 평균이므로 해석이 직관적입니다.

  2. RMSE(Root Mean Squared Error): 오류의 제곱 평균에 루트를 씌운 값으로, 큰 오차에 더 민감하게 반응합니다. 그렇기 때문에, 다소 과적합을 방지하는 데 도움이 될 수 있습니다.

  3. r2(결정 계수): 이는 모델이 전체 변동성 중에서 설명할 수 있는 비율을 나타내며, 1에 가까울수록 모델의 설명력이 높다고 해석합니다.

구체적으로 어느 수치가 좋다는 것은 데이터의 특성과 문제의 정의에 따라 다를 수 있지만, 일반적으로는 비교 대상이 되는 모델들 간의 상대적인 성능 차이를 통해 좋은 모델을 선택합니다. 즉, 다양한 모델을 활용하여 각 평가지표를 비교함으로써 최적의 모델을 선정하는 것이 일반적입니다. 다만, 분야나 데이터의 특성에 따라 ‘좋은’ 기준이 다를 수 있으므로, 절대적인 수치보다는 상대적인 비교를 통해 판단하시길 추천드립니다.

관련된 내용을 더 심층적으로 이해하고 싶으시다면 아래의 질문 및 답변을 참고하시면 도움이 될 것입니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드립니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

김경원님의 프로필 이미지
김경원

작성한 질문수

질문하기