인프런 커뮤니티 질문&답변

hyeonseung11님의 프로필 이미지
hyeonseung11

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

작업형2 모의문제2

작업형2 모의문제2 질문

해결된 질문

작성

·

178

·

수정됨

0

히스토그램이랑 describe로 확인한 price 값 중에 굉장히 멀리떨어져있는 값이 나왔는데, 이건 이상치로 해석하는게 아닌가요?'

그리고 강의에서 r 2값이 0.077이 나왔는데. 이게 평가 지표에서 좋게 받을 수 있는건가요?

R에서는 상관관계랑 *** 로 변수를 선택하는게 있었던거 같은데, 파이썬에서는 그냥 진행해야하는건가요?

 

답변 1

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

hist를 찍어볼 수가 없어서 시험에서는 이상치를 찾는 것은 쉽지 않을 것 같아요!
제거 한다면 좋겠지만 어렵다면 그대로 진행하는 것을 추천합니다.

선형회귀(리니어 리그레이션)모델을 사용한다면 변수(피처)선택이 필요
랜덤포레스트, lightgbm을 사용한다면 중요도를 알아서 낮게 잡아요!

평가 지표는 객관적으로 또는 비교할 수가 없는 환경이에요!

따라서 본인 베이스라인보다 조금 더 점수가 좋게 나오는 방향으로 전처리 또는 튜닝하면 됩니다.

hyeonseung11님의 프로필 이미지
hyeonseung11

작성한 질문수

질문하기