• 카테고리

    질문 & 답변
  • 세부 분야

    딥러닝 · 머신러닝

  • 해결 여부

    미해결

평가 실습 - 피마 인디언 당뇨병 예측

23.12.18 17:17 작성 조회수 108

0

안녕하세요.

수업 중 궁금한 사항이 있습니다.

diabetes_data[zero_features] = diabetes_data[zero_features].replace(0, diabetes_data[zero_features].mean())

이렇게 구현하면 0이 평균에 포함되어서 평균값이 왜곡되지 않는지요?

diabetes_data[zero_features].mean()

 

아래와 같은 식으로 0제외한 값으로 대체 되어야하는것 아닐지요?

diabetes_data[diabetes_data[feature] != 0][feature].mean()

특정한목은 43%나 0값이 있는데, 0을 포함한 평균값이면 평균값이 매우 낮아질것 같아서요.

 

감사합니다.

 

답변 1

답변을 작성해보세요.

0

안녕하십니까,

음, 말씀하신 부분대로 하는게 보다 더 정확한 평균 값이겠군요.

날카로운 지적, 감사합니다. ^^