해결된 질문
작성
·
178
·
수정됨
답변 1
0
hist를 찍어볼 수가 없어서 시험에서는 이상치를 찾는 것은 쉽지 않을 것 같아요!
제거 한다면 좋겠지만 어렵다면 그대로 진행하는 것을 추천합니다.
선형회귀(리니어 리그레이션)모델을 사용한다면 변수(피처)선택이 필요
랜덤포레스트, lightgbm을 사용한다면 중요도를 알아서 낮게 잡아요!
평가 지표는 객관적으로 또는 비교할 수가 없는 환경이에요!
따라서 본인 베이스라인보다 조금 더 점수가 좋게 나오는 방향으로 전처리 또는 튜닝하면 됩니다.