• 카테고리

    질문 & 답변
  • 세부 분야

    데이터 분석

  • 해결 여부

    미해결

결측치

21.08.11 10:26 작성 조회수 137

1

이 강의에서는 결측치가 많은 컬럼 제거를 어떻게 하는지 보여주는 거고 실제로는 결측치가 많은 컬럼을 제거 할 때 그 데이터가 필요있는지 없는지 유무를 따지고 그 데이터가 필요없는 것 들 중에서 결측치가 많은 것을 지우는 것을 판단하나요??
무작정 결측치가 많다고 컬럼을 없애면 안되지 않나여

답변 1

답변을 작성해보세요.

0

안녕하세요.

결측치 처리는 다양한 논문 주제로도 쓰이고 있습니다.

질문 주신 것처럼 결측치를 임의로 제거하거나 대체해서는 안 되겠죠.

목적에 따라 결측치를 제거하거나 대체해야 될텐데, 이 때는 다양한 변수와 도메인에 대한 노하우가 필요합니다.

또, 머신러닝, 딥러닝에서도 이런 결측치를 처리하는 여러 방법이 있는데 

어떤 방법이 맞다vs틀리다, 좋다vs나쁘다 보다는 사용하고자 하는 목적과 다른 변수와의 쓰임에 따라 처리해야 합니다.