강의

멘토링

커뮤니티

인프런 커뮤니티 질문&답변

합격님의 프로필 이미지
합격

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

10회 기출유형(작업형2)

결측치 질문

해결된 질문

작성

·

32

0

10회 작업형2

타겟 변수(총가스사용량)는 일부 값이 0으로 기재되어 있으며, 이는 결측치를 대체한 값임.

 

관련하여

두번째 방법인

target=target[~cond] 로 했을때

오류가 줄어들어 더 좋은 값이면

이걸로 하는게 더 좋은건가요?

 

보통 결측치가 있을때는

그럼 결측치를 다른 값으로 대체하거나, 그렇게 하라고 문제에서 주어지나요?

그럼 fillna()로 사용해서 넣는건가요?

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

작업형2에서 아직 결측치 처리와 관련해 특별한 작업을 요구한적은 없었어요 🙂 다른 회차와 동일했습니다.

0

안녕하세요, 인프런 AI 인턴입니다. 합격님이 결측치 처리에 대해 질문을 주셨네요.

결측치 처리의 경우, 데이터 분석에서는 중요한 문제로, 주어진 상황과 목표에 따라 다양한 접근 방법이 필요할 수 있습니다.

결측치 처리 방법

  1. ‘gas_totl(taeget)‘의 결측치를 0으로 대체: 이는 일반적으로 결측치가 분석에 심각한 영향을 미치지 않는다는 가정 하에, 단순히 0으로 대체하는 방법입니다. 이는 실제로 결측치의 의미가 0에 가깝다고 판단될 때 주로 사용됩니다.

  2. target=target[~cond] 방법: 이 방식은 특정 조건을 사용하여 데이터의 행이나 열을 제거하는 것이므로 데이터의 구조와 모양이 변경될 수 있습니다. 모델의 성능이 개선되는 경우 이 방식을 선택할 수 있지만, 데이터가 손실될 수 있으므로 조심해야 합니다.

  3. 결측치 대체 시 fillna() 사용:

    • fillna()는 결측치를 특정 값으로 대체할 때 사용됩니다. 예를 들어 평균, 중앙값, 최빈값 등으로 대체할 수 있습니다.

문제의 경향이나 요구 사항에 따라서도 결측치 처리 방법이 달라질 수 있기 때문에 문제에서 명시한 방법론을 따르는 것이 좋습니다. 시험에서는 주로 문제에서 지정한 방법을 사용하는 것이 안전합니다.

아래 링크들이 결측치 관련 과정에 대해 좀 더 이해를 도와줄 수 있을 것 같습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏

추가적인 질문이 있으시면 계속해서 문의해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

합격님의 프로필 이미지
합격

작성한 질문수

질문하기