inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[2026년 빅분기 실기 준비] 빅데이터 분석 기사 실기 시험 100% 합격 ! 기출 문제의 패턴이 보인다 !

7회 작업형3 문제1

작업형 제 2유형 질문

83

유창균

작성한 질문수 10

0

잦은 질문으로 귀찮게 해드려 죄송합니다 ㅜ

2유형에서 지금까지 기출에서 결측치가 없는 상태로 출제가 되었는데 만약 결측치가 있을 경우

코딩순서와 어떻게 결측치를 대치하는지 풀이가 궁금합니다ㅜㅜ

빅데이터 빅데이터분석기사

답변 2

0

코딩 대한민국

네 만약 결측치가 있다면 숫자형 컬럼이면 평균값을 채우시면됩니다. 순서는 맨처음 데이터 불러오고 바로 결측치 확인해보고 있으면 처리하시면 됩니다^^

0

유창균

감사합니다!

0

인프런 AI 인턴

안녕하세요, 인프런 AI 인턴입니다. 유창균님, 결측치 처리에 대한 질문을 주셨네요. 이것은 데이터 전처리 단계에서 매우 중요합니다.

결측치 처리의 중요성

결측치는 데이터 분석 과정에서 종종 발생하는 문제이며, 잘못된 분석 결과를 초래할 수 있기 때문에 적절히 처리해야 합니다.

결측치 처리 순서

  1. 데이터 탐색: 결측치가 어디에 얼마나 있는지를 먼저 탐색합니다. 흔히 pandasisnull() 또는 info() 메소드를 사용하여 결측치를 확인합니다.

  2. 결측치 대체 방법 선택:

    • 삭제: 결측치가 전체 데이터의 일부에 불과하고, 결측치 행을 제거하여도 데이터의 대표성을 잃지 않을 때 사용합니다.
    • 대체: 평균, 중간값, 최빈값으로 대체하는 방법이 있습니다. 대체할 값을 결정할 때는 데이터의 특성을 고려해야 합니다.
    • 예측 모델 사용: 더 고급 방법으로, 다른 피처를 통해 결측치를 예측하는 모델을 사용할 수 있습니다.
  3. 코딩 예제: pandas 패키지를 사용해 결측치를 처리하는 예제는 다음과 같습니다.
    ”`python
    import pandas as pd

# 예시 데이터프레임
df = pd.read_csv(‘your_data.csv’)

# 결측치 확인
print(df.isnull().sum())

# 평균값으로 대체
df.fillna(df.mean(), inplace=True)

# 특정 열을 대상으로 중간값으로 대체
df[‘column_name’].fillna(df[‘column_name’].median(), inplace=True)
“`

기존 질문에 대한 답변을 참고하시면 추가적으로 도움이 될 수 있습니다:
- “데이터 전처리에서 결측치 처리하기”

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

수강 기한 연장 문의

0

79

4

코랩 기본 사용법 문의

0

65

1

8회 작업형1 문제2

0

61

2

4회 2유형 1번 문제

0

50

1

다중 선형 회귀 상수항 추가 관련 질문

0

91

2

10회 작업형1번문제2번 문제 풀이 틀림

0

77

2

8회 1유형 1번 문제

0

76

1

답변 항상 감사드립니다. 질문 있습니다.

0

71

2

원핫인코딩 이후 칼럼 불일치 문제

0

68

2

6회 1유형 3번 문제

0

65

1

코딩 방법에 따른 채점 기준에 관하여 질문있습니다.

0

82

1

데이터 파일들은 어디서 다운받을 수 있나요?

0

83

2

선형회귀분석 질문

0

51

2

링크가안보여요 어디에올라와있는거죠대체 ? 구글코랩파일이요

0

86

4

범주형 인코딩

0

87

2

원핫인코딩시 라벨링질문

0

80

1

인코딩 질문!!

0

75

1

유형2 질문!!

0

62

2

6회 작업형 2 문제 1

0

63

1

작업형 유형 2에서,,, train, test, split 시 성능

0

126

2

항상 모델학습하실때 train_test_split일부러 안하시는 이유가 있는건가요?

0

97

2

Label Encoding 관련 질문

0

104

3

상수항 질문드립니다. (6회 작업형 2문제)

0

52

1

2유형 답안 제출 시 문의

0

62

1