inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

작업형1_section14 문의

2

imz0629

작성한 질문수 1

0

작업형1_section14 에서

fillna(0)을 적용한 뒤 map() 함수를 사용하면 최종 결과 값은 동일하나 df 조회 시 다시 결측값이 발생됩니다.

이 경우 map() 대신 replace()를 사용하는 것이 맞는지 궁금합니다.

# 값 대체
df['f3'] = df['f3'].fillna(0)
dict_list = {'silver':1, 'gold':2, 'vip':3}
df['f3'] = df['f3'].map(dict_list)

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 1

0

인프런 AI 인턴

안녕하세요, 인프런 AI 인턴입니다.

imz0629님이 작업형1_section14에서 fillna(0)을 적용한 뒤 map() 함수를 사용하는 경우 발생하는 결측값 문제에 대해 질문을 주셨네요.

map() 함수는 지정된 매핑에 없는 값들을 NaN으로 치환하기 때문에, 앞서 fillna(0)을 사용하더라도 map() 함수를 사용하면 원래 NaN이었던 값들이 다시 NaN으로 되돌아갑니다. 따라서, 이 상황에서는 replace()를 사용하는 것이 적절합니다. replace()는 매핑된 값뿐만 아니라 나머지 값들도 그대로 유지하기 때문에 의도치 않은 NaN 값을 생성하지 않습니다.

관련하여 유사한 이슈와 해결방법을 설명한 질문이 있는 링크를 참고하실 수 있습니다:
- 문제3 변환 관련 문의: 데이터 변환 명령어 사용의 차이점을 설명하고 있습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

34강 평가지표

0

2

0

103강 작업2형 전처리(레이블인코딩 부분) 오류

0

1

1

작업형1_연습문제 7번 관련입니다.

0

7

1

데이터 프레임 슬라이싱 혹은 데이터 선택하기가 어렵습니다.

0

7

1

크로스 밸리데이션 질문

0

13

2

로지스틱 회귀분석 질문

0

14

2

수치형 데이터만 선택하여 푸는 경우에 오답확률이 높아질까요?

0

22

2

2유형 object 컬럼 인코딩 관련 질문

0

31

2

하이퍼파라미터 변수

0

28

2

52강 이원분산분석

0

25

2

실제시험환경에서 작업형1,2,3의 문제풀이 순서

0

29

2

독립표본검정

0

25

2

tranform을 쓰라는 힌트는 어디서 얻을 수 있나요??

0

35

2

df.describe() 사용을 자제해야할까요?

0

33

2

shape 결과에 대한 문의

0

37

2

자료 문의

0

31

2

8 회귀 11번

0

26

2

심화 강의 관련 질문

0

35

2

빈도수 구하는 것 질문

0

26

2

커리큘럼을 따로 인쇄할 수 있는 방법이 있을까요?

0

38

1

작업형2 머신러닝 문제풀이 중 test 데이터 에러 문의

0

34

2

수강연장가능문의

0

44

2

59. 11회 기출 유형 작업형 1 - 문제2 관련

0

37

2

원핫인코딩 슬라이싱 결과

0

33

2