인프런 커뮤니티 질문&답변
답변 1
0
companionclub
지식공유자
안녕하세요.
강의에 관심가져주셔서 감사드립니다.
강의자료에 사용한 이상치 탐지 방법은 IQR을 이용해서 찾은 방법입니다.
또한, 출제예상에 사용한 방법은 금액이 0보다 작은경우를 이상치로 판단하였습니다.
문제에서 명확하게 제시하지 않으면 이상치 판단에 대한 기준이 애매합니다.
일단, 작업형1유형의 경우는 문제에 나와있는대로 정의하시면 될 것 같습니다.
작업형2유형이 문제인데요. 주관적인 판단을 통해 이상치를 탐지하고 제거하고 모델을 만들어야 합니다.
강의때 말씀드린바와 같이 이상치로 인해서 숫자형 변수가 문자형변수가 되었다던가 하는 경우는
열 전체를 없애는 방법을 추천드립니다. 숫자형 변수내에서 이상치를 탐지하실 경우는
명확하게 (예를들어, 금액인 경우 음수가 나오면 안됨) 정의된 경우만 제거하시고
그 이외는 그냥 그대로 이용하시는 것을 추천드립니다.
감사합니다.





