강의

멘토링

커뮤니티

인프런 커뮤니티 질문&답변

합격님의 프로필 이미지
합격

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

예시문제 작업형1 (ver. 2025) 🆕

df=~적는것

해결된 질문

작성

·

22

0

안녕하세요

df['고객만족도'].fillna(m)할때

앞에 다시 df['고객만족도'] = ~ 붙이는거랑

df.dropna(subset='근속연수')

앞에 df = ~ 붙이는게

 

정확하게 붙이는 이유가 이해가 되지 않습니다..

뭔가 작업을 할떄

앞에 df ~를 다시 붙여준다고 생각하면 될까요?

감사합니다

 

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

= 는 "대입"의 의미입니다.

=를 기준으로 왼쪽과 오른쪽이 있을 때

오른쪽의 계산 결과를 "df['고객만족도'].fillna(m)"

왼쪽 변수에 저장(대입)하는 것이죠 df['고객만족도']

 

쉽게 말하면 저장의 의미로 봐주세요

모든 전처리 작업은 결과를 다시 대입해야 저장이 됩니다. 혹은 inplace 파라미터를 사용하는 방법이 있음

0

안녕하세요, 인프런 AI 인턴입니다. 합격님.

판다스를 사용하여 데이터프레임을 조작할 때, 특정 조작을 한 결과를 다시 원본 데이터프레임에 반영하거나, 새로운 형태로 저장하고자 할 때 df[...] = ... 형태를 사용합니다. 이는 데이터프레임의 특정 부분을 변경하거나 새로운 데이터프레임을 만들고자 할 때 중요합니다.

  1. df['고객만족도'] = df['고객만족도'].fillna(m): 이 코드는 ‘고객만족도’ 컬럼의 결측치를 m으로 채운 결과를 원래 ‘고객만족도’ 컬럼에 다시 저장합니다. 이렇게 하면, 원래의 데이터프레임의 구조와 다른 컬럼을 그대로 보존하면서 해당 컬럼만 업데이트하게 됩니다.

  2. df = df.dropna(subset=['근속연수']): 이 코드는 ‘근속연수’ 컬럼에 결측치가 있는 행들을 삭제하고, 그 결과를 df에 다시 저장합니다. 이 경우, 데이터프레임의 행을 조작하여 필요 없는 데이터를 제거하고, 그 결과를 원래 데이터프레임 구조(즉, 모든 컬럼을 가진 상태)로 유지하려는 것입니다.

요약하자면, 특정 컬럼이나 데이터프레임 전체를 조작한 결과를 다시 데이터프레임에 반영하고자 할 때 앞에 df[...] = ...df = ...를 사용합니다. 이를 통해 원하는 변화를 원본 데이터에 반영할 수 있습니다.

더 이해를 돕기 위해, 다음의 관련 질문들을 참고하시면 좋습니다:
- 예시문제 작업형1 (ver. 2025): fillna와 dropna의 차이점과 사용법에 대한 예를 다루고 있습니다.
- 작업형1 모의문제1 관련 질문입니다.: dropna 사용 시의 주의점과 일반적인 오류 상황을 설명합니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

합격님의 프로필 이미지
합격

작성한 질문수

질문하기