Inflearn brand logo image

인프런 커뮤니티 질문&답변

유창균님의 프로필 이미지
유창균

작성한 질문수

[2025년 최신 기출 반영] 빅데이터 분석 기사 실기 시험 100% 합격 ! 기출 문제의 패턴이 보인다 !

7회 작업형3 문제1

작업형 제 2유형 질문

작성

·

61

0

잦은 질문으로 귀찮게 해드려 죄송합니다 ㅜ

2유형에서 지금까지 기출에서 결측치가 없는 상태로 출제가 되었는데 만약 결측치가 있을 경우

코딩순서와 어떻게 결측치를 대치하는지 풀이가 궁금합니다ㅜㅜ

답변 2

0

코딩 대한민국님의 프로필 이미지
코딩 대한민국
지식공유자

네 만약 결측치가 있다면 숫자형 컬럼이면 평균값을 채우시면됩니다. 순서는 맨처음 데이터 불러오고 바로 결측치 확인해보고 있으면 처리하시면 됩니다^^

유창균님의 프로필 이미지
유창균
질문자

감사합니다!

0

안녕하세요, 인프런 AI 인턴입니다. 유창균님, 결측치 처리에 대한 질문을 주셨네요. 이것은 데이터 전처리 단계에서 매우 중요합니다.

결측치 처리의 중요성

결측치는 데이터 분석 과정에서 종종 발생하는 문제이며, 잘못된 분석 결과를 초래할 수 있기 때문에 적절히 처리해야 합니다.

결측치 처리 순서

  1. 데이터 탐색: 결측치가 어디에 얼마나 있는지를 먼저 탐색합니다. 흔히 pandasisnull() 또는 info() 메소드를 사용하여 결측치를 확인합니다.

  2. 결측치 대체 방법 선택:

    • 삭제: 결측치가 전체 데이터의 일부에 불과하고, 결측치 행을 제거하여도 데이터의 대표성을 잃지 않을 때 사용합니다.
    • 대체: 평균, 중간값, 최빈값으로 대체하는 방법이 있습니다. 대체할 값을 결정할 때는 데이터의 특성을 고려해야 합니다.
    • 예측 모델 사용: 더 고급 방법으로, 다른 피처를 통해 결측치를 예측하는 모델을 사용할 수 있습니다.
  3. 코딩 예제: pandas 패키지를 사용해 결측치를 처리하는 예제는 다음과 같습니다.
    ”`python
    import pandas as pd

# 예시 데이터프레임
df = pd.read_csv(‘your_data.csv’)

# 결측치 확인
print(df.isnull().sum())

# 평균값으로 대체
df.fillna(df.mean(), inplace=True)

# 특정 열을 대상으로 중간값으로 대체
df[‘column_name’].fillna(df[‘column_name’].median(), inplace=True)
“`

기존 질문에 대한 답변을 참고하시면 추가적으로 도움이 될 수 있습니다:
- “데이터 전처리에서 결측치 처리하기”

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

유창균님의 프로필 이미지
유창균

작성한 질문수

질문하기