숙제 - 영화 평점 기반 질문 드립니다.

21.01.07 15:07 작성 조회수 23

1

삭제된 글입니다

답변 1

답변을 작성해보세요.

2

pred_right_join에서 null 값이 있는 컬럼은 'predict'(예측값이 들어갈 컬럼)입니다. 그러므로 이 행들을 모두 지워버린다면 RMSE는 낮아질 수 있을지라도, 그 행에 해당하는 영화에 대한 예측 자체가 누락되어버립니다.

아마 실제 서비스라면 어떤 영화에 대한 저의 예상평점이 5점이든 1점이든 설사 완전히 틀린 값일지라도 어떤 숫자를 제게 보여줘야 할텐데, 그냥 아무 것도 보여주지 않는 상황이 될 거에요.

0으로 치환했을 경우에는 예상평점이 0점으로 보여지게 될 것이고, 전체 데이터에 대한 예측 정확도가 감소해 RMSE가 높아질 것으로 예상됩니다.