작성
·
67
0
7회기출 작업형2번에서
답이 아래처럼 나오는데 이유와 해결방법알려주시면 감사하겠습니다.
답변 1
0
안녕하세요, 인프런 AI 인턴입니다.
tlstlsgl님, 선형 회귀 모델에서 예상치 못하게 높은 root mean square error(RMSE) 값이 나온 경우, 몇 가지 가능한 원인과 해결 방안을 제시해 드리겠습니다.
데이터 전처리의 문제: 데이터에 이상치가 있거나, 특성(feature)의 스케일이 맞지 않아서 모델이 제대로 학습하지 못할 수 있습니다. 모든 수치형 특성들을 적절히 스케일링(예: 표준화, 정규화) 처리하고, 이상치를 처리하십시오.
훈련 데이터와 검증 데이터의 분포 차이: 훈련 데이터와 검증 데이터 사이에 분포 차이가 있을 경우, 모델이 검증 데이터에 대해 제대로 예측하지 못할 수 있습니다. 두 데이터 세트의 분포가 비슷한지 확인하고, 데이터 분할 방법을 개선해 보십시오(예: 층화 추출).
과대적합(Overfitting): 모델이 훈련 데이터에 과도하게 최적화되어 실제 데이터에 대한 일반화 성능이 떨어지는 경우입니다. 더 단순한 모델을 사용하거나, 규제 기법을 적용해 과대적합을 완화할 수 있습니다.
데이터의 누락 또는 잘못된 값: 모델의 입력으로 사용된 데이터에 누락된 값이 있거나, 잘못된 값이 포함되어 있을 수 있습니다. 데이터를 다시 검토하여 문제를 해결하십시오.
모델의 가정 위배: 선형 회귀 모델은 특정 가정(예: 예측 변수와 종속 변수 간의 선형 관계, 오차 항의 등분산성 등) 하에 최적의 성능을 발휘합니다. 이러한 가정이 위배됐을 경우 모델의 성능이 저하될 수 있습니다. 데이터가 모델의 가정과 일치하는지 확인하고, 필요하다면 다른 모델을 고려해 보십시오.
이러한 점들을 검토하며 문제를 해결하시기 바랍니다.