-
카테고리
-
세부 분야
데이터 분석
-
해결 여부
미해결
결측치
21.08.11 10:26 작성 조회수 137
1
이 강의에서는 결측치가 많은 컬럼 제거를 어떻게 하는지 보여주는 거고 실제로는 결측치가 많은 컬럼을 제거 할 때 그 데이터가 필요있는지 없는지 유무를 따지고 그 데이터가 필요없는 것 들 중에서 결측치가 많은 것을 지우는 것을 판단하나요??
무작정 결측치가 많다고 컬럼을 없애면 안되지 않나여
답변을 작성해보세요.
0
박조은
지식공유자2021.08.11
안녕하세요.
결측치 처리는 다양한 논문 주제로도 쓰이고 있습니다.
질문 주신 것처럼 결측치를 임의로 제거하거나 대체해서는 안 되겠죠.
목적에 따라 결측치를 제거하거나 대체해야 될텐데, 이 때는 다양한 변수와 도메인에 대한 노하우가 필요합니다.
또, 머신러닝, 딥러닝에서도 이런 결측치를 처리하는 여러 방법이 있는데
어떤 방법이 맞다vs틀리다, 좋다vs나쁘다 보다는 사용하고자 하는 목적과 다른 변수와의 쓰임에 따라 처리해야 합니다.
답변 1