강의

멘토링

커뮤니티

인프런 커뮤니티 질문&답변

iurban님의 프로필 이미지
iurban

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

작업형1 모의문제3

bfill / ffill 관련 질문입니다.

작성

·

13

·

수정됨

0

문제 8번의 df.fillna(method='bfill') 관련입니다.

 

  1. bfill의 경우, 데이터 최하단 행에 있는 결측치는 어떻게 해결할 수 있을까요?

     

  2. 마찬가지로 ffill의 경우, 데이터 최상단 행에 있는 결측치는 어떻게 해결 가능한지 궁금합니다.

 

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

AI가 잘 말해주고 있는데

수동으로 직접 채워야합니다 🙂

0

안녕하세요, 인프런 AI 인턴입니다. iurban님.

Pandas의 bfillffill 메소드 사용 시 발생할 수 있는 결측치 처리에 대한 질문을 주셨네요. 관련 방법을 이해하는 데 도움이 될 수 있도록 설명드리겠습니다.

1. bfill의 경우, 최하단 행 결측치 해결 방법

  • bfill(backward fill)은 데이터프레임의 요약행 혹은 최하단 행에 결측치가 있을 경우, 바로 뒤로 채울 데이터가 없어 그대로 남게 됩니다. 이를 해결하기 위해서는 다른 방법으로 결측치를 채워주어야 합니다. 예시는 중앙값, 평균값 이용 혹은 특정한 숫자로 채우는 방식 등이 있습니다.

예를 들어, 데이터프레임 df 최하단의 결측치를 0으로 채우고 싶다면:

  df.fillna(0, inplace=True)

2. ffill의 경우, 최상단 행 결측치 해결 방법

  • ffill(forward fill)은 반대로 데이터프레임의 상단 데이터에 결측치가 있을 경우, 앞쪽으로 채울 데이터가 없어 최상단의 결측치는 채워지지 않습니다. 유사하게, 다른 대체 방법으로 결측치를 해결해야 합니다.

최상단 결측치를 예를 들어 평균값으로 채우고 싶다면:

  df.fillna(df.mean(), inplace=True)

기본적으로 ffill이나 bfill은 인접한 값들을 활용해 결측치를 채우는 방식이므로 데이터의 위나 아래에서 시작되는 결측치들에 대해서는 다른 방식으로 별도 처리가 필요합니다.

관련된 게시물도 참고하시면 도움이 될 것 같습니다:
- 결측치 처리(fillna(method = ‘bfill’)) 질문입니다.
- fillna 함수 질문드립니다!

각 게시물에서 fillna() 함수를 사용하여 결측치를 대체하는 다양한 방법이 논의되고 있으니 참고 부탁드립니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

iurban님의 프로필 이미지
iurban
질문자

bfill이나 ffill로 모든 결측치를 채우되, 최하단/최상단 결측치에 대해서만은 추가로 별도 처리하는 방법을 알고 싶습니다.

iurban님의 프로필 이미지
iurban

작성한 질문수

질문하기