강의

멘토링

커뮤니티

인프런 커뮤니티 질문&답변

semistone6239님의 프로필 이미지
semistone6239

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

2회 기출유형(작업형1)

2회 기출유형(작업형1) 질문

해결된 질문

작성

·

28

0

min_value = df['views'].iloc[9]
df['views'].iloc[:10] = min_value

이 코드는 왜 안되는지 궁금합니다

df.iloc[:10,-1] = min_value

 

풀이의 이 코드는 데이터 프레임에서 슬라이싱한거고

제 코드는 시리즈 형태에서 슬라이싱한거같은데 이렇게는 안되나요

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

판다스에서는 그냥 불러올때는 상관 없으나
값을 변경할 때는 체이닝된 인덱싱([][] 또는 .iloc[][])보다는 단일 인덱싱(iloc[rows, cols])을 사용하는 것이 안전하고 명확합니다.

# 체이닝된 인덱싱 (값 변경 시 문제)

df['views'][0:10] = min_value

df['views'].iloc[:10] = min_value

# 단일 인덱싱 (값 변경 시 안전)

df.iloc[:10, -1] = min_value

df.loc[:9, 'views'] = min_value

0

안녕하세요, 인프런 AI 인턴입니다. semistone6239님.

질문하신 코드에 대한 차이를 이해하고자 하시는 의도는 판다스를 활용한 데이터 프레임과 시리즈 객체의 슬라이싱 및 인덱싱 동작 방식 차이에 대한 것입니다. 이 점에 대해 자세히 설명 드리겠습니다.

pandas에서 DataFrame과 Series

  • df.iloc[:10, -1] = min_value는 데이터 프레임 전체에서 열을 대상으로 하여 특정 범위의 값을 지정하는 방식입니다. 이는 데이터프레임의 마지막 열(이 경우, ‘views’ 열)에 대해 처음 10개의 행을 수정하는 코드입니다.

  • df['views'].iloc[:10] = min_value는 시리즈 객체(df['views'])에서 슬라이싱을 사용하여 처음 10개의 값을 특별한 값으로 대체하는 코드입니다. 하지만 이 과정에서 주의할 점이 있습니다. 판다스의 경고에 따라, 슬라이싱된 시리즈 객체의 값을 직접 변경하는 것은 ‘SettingWithCopyWarning’ 경고를 발생시킬 수 있으며, 이는 데이터 프레임의 원본이 변경되지 않을 가능성을 암시할 수 있습니다.

문제의 원인과 해결책

  • 직접 시리즈 객체에서 값을 수정하기보다는 데이터 프레임 차원에서 접근하여 수정하는 것이 일반적으로 권장됩니다. 예를 들어, 다음과 같이 사용할 수 있습니다:
  df.loc[df.index[:10], 'views'] = min_value

이렇게 되면, 데이터프레임 df에서 ‘views’ 열의 처음 10개의 행을 안전하게 수정할 수 있습니다.

또한, 복잡한 데이터프레임 조작에서는 항상 원본 데이터가 의도하지 않게 변경되지 않았는지 확인하는 것이 중요합니다. 이러한 세부 사항을 숙지하는 것은 데이터 분석 전문가로 성장하는 데 있어 중요한 부분입니다.

기타 자세한 정보는 이 유사한 질문을 참고하세요. 여기에서 pandasilocloc 사용 방식의 차이에 대해 더 많은 내용을 확인하실 수 있습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

semistone6239님의 프로필 이미지
semistone6239

작성한 질문수

질문하기