강의

멘토링

커뮤니티

인프런 커뮤니티 질문&답변

이준호님의 프로필 이미지
이준호

작성한 질문수

빅데이터분석기사 실기대비 (R 활용)

데이터 병합, 결측치, 이상치 처리

이상치 유무 판단

작성

·

271

0

실습에서 이상치 유무를 판단하는것은 최대, 최소값을 통해 파악한 건지요??

답변 1

0

companionclub님의 프로필 이미지
companionclub
지식공유자

 

안녕하세요. 

강의에 관심가져주셔서 감사드립니다.

 

강의자료에 사용한 이상치 탐지 방법은 IQR을 이용해서 찾은 방법입니다.

또한, 출제예상에 사용한 방법은 금액이 0보다 작은경우를 이상치로 판단하였습니다.

 

문제에서 명확하게 제시하지 않으면 이상치 판단에 대한 기준이 애매합니다.

일단, 작업형1유형의 경우는 문제에 나와있는대로 정의하시면 될 것 같습니다.

작업형2유형이 문제인데요. 주관적인 판단을 통해 이상치를 탐지하고 제거하고 모델을 만들어야 합니다.

 

강의때 말씀드린바와 같이 이상치로 인해서 숫자형 변수가 문자형변수가 되었다던가 하는 경우는

열 전체를 없애는 방법을 추천드립니다. 숫자형 변수내에서 이상치를 탐지하실 경우는

명확하게 (예를들어, 금액인 경우 음수가 나오면 안됨) 정의된 경우만 제거하시고

그 이외는 그냥 그대로 이용하시는 것을 추천드립니다.

 

감사합니다.

 

 

이준호님의 프로필 이미지
이준호

작성한 질문수

질문하기