강의

멘토링

로드맵

Inflearn Community Q&A

lida9311276139's profile image
lida9311276139

asked

[After Work Side Projects] Big Data Analytics Engineer Practical Exam (Task Types 1, 2, 3)

Modeling and Evaluation (Regression)

rmse(np.exp(y_val),no.exp(pred)) 작업시 나오는 에러메세지 해결 방법

Resolved

Written on

·

325

0

  • rmse를 진행하는 부분에서
  • rmse(y_val,pred) 라고 진행하면 문제가 없으나
  • 후에 y값에 들어갈 charges 컬럼 데이터에 로그를 씌워 단위 변환한 평가값과 비교하기 위해
  • 기존 데이터 평가에 rmse(np.exp(y_val),np.exp(pred))를 씌워보면
  • Found input variables with inconsistent numbers of samples: [161, 268]
  • 혹은
  • Input contains infinity or a value too large for dtype('float64').
  • 와 같은 에러가 뜹니다. 혹시 제가 어떤 작업을 놓친 걸까요?
python머신러닝빅데이터pandas빅데이터분석기사

Answer 1

0

roadmap님의 프로필 이미지
roadmap
Instructor

  • Found input variables with inconsistent numbers of samples: [161, 268]

우선 pred결과가 검증데이터의 결과가 맞는지 확인이 필요할 것 같아요
검증(val) 데이터는 평가가능하지만 실제 제출용(test)데이터는 자체 평가가 불가능합니다.
len(y_val), len(pred)과 크기를 한번 확인해주세요!


Input contains infinity or a value too large for dtype('float64').

값이 너무 커져서 이런 상황이 나타난 것 같아요. 로그 적용 부분이 의심됩니다.
로그 적용은 필수가 아니라 심화 학습이에요! 기출까지 본 후 학습해도 됩니다.

train['charges'] = np.log1p(train['charges'])


lida9311276139's profile image
lida9311276139

asked

Ask a question