Inflearn brand logo image

인프런 커뮤니티 질문&답변

smrudsla님의 프로필 이미지
smrudsla

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

기출10회 작업형2 결측치처리

작성

·

213

0

  • 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!

  • 질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요

  • 먼저 유사한 질문이 있었는지 검색해보세요

타겟에 결측치가 있는 것에 대해 처리를 안하고 제출했는데

그러면 무조건 틀리나요..?ㅠ

점수는 잘 나왔습니다

답변 5

1

제가 조회 했을땐 결측치가 없었긴 합니다.

걱정안하셔도 될거 같은데요.^^

전 하이퍼튜닝을 해서 495였나..그정도까지 만들었습니다.

test_size를 0.26하니 많이 낮아 지더군요.

1

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

비율이 크진 않고 도메인을 알 수 없어

저라도 처리 안하고 제출했을 것 같아요

 

틀리진 않았습니다

다만 의도는 출제자만 알 수 있을 것 같아요

실제 데이터인지 아님 임의로 제거한건지…

1

문제에 결측치는 0으로 처리한다고 되어있고 0으로 들어가있길래 그게 결측치 처리한거라 생각해서 그냥뒀네요.

근데 결측치 처리한사람도 400후반에서 500대같더군요

1

안녕하세요, 인프런 AI 인턴입니다. smrudsla님!

기출 문제에서 타겟 변수에 결측치가 있는 경우, 결측치를 처리하지 않고 제출하면, 일반적으로 성능에 영향을 미칠 수 있지만, 반드시 틀린 것은 아닙니다. 점수가 잘 나온 경우라면 데이터의 특성상 결측치가 큰 영향을 미치지 않았거나 모델이 해당 결측치를 잘 처리했을 가능성도 있습니다.

결측치 처리에 대한 일반적인 가이드라인

  1. 결측치 제거:

    • 결측치가 매우 적은 경우, 해당 행을 삭제하는 것이 하나의 방법입니다.
  2. 결측치 대체(imputation):

    • 평균, 중앙값, 최빈값 또는 데이터의 도메인 지식에 기반하여 결측치를 대체할 수 있습니다.
  3. 모델 기반 대체:

    • 다른 피처를 사용하여 결측치를 예측하는 방법도 있습니다.

결론적으로, 결측치를 처리하지 않고도 점수가 잘 나왔다면, 그 데이터셋에 대해서는 문제가 없는 것으로 보일 수 있습니다. 그러나 일반적으로는 결측치 제거나 대체가 방법론적으로 추천됩니다.

아래는 유사한 주제로 논의한 게시물입니다. 더 많은 정보를 확인해 보세요:

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

0

smrudsla님의 프로필 이미지
smrudsla
질문자

강사님 그리고 선생님들 답변 감사드립니다!

완전 틀린건 아니라 한시름 덜었네요

이제 사전답변을 손꼽아 기다려야겠습니다..

모두들 원하시는 결과 이루시길 바랍니다!!

고생하셨습니다!!

smrudsla님의 프로필 이미지
smrudsla

작성한 질문수

질문하기