inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

2회 기출유형(작업형1)

2회 기출유형(작업형1) 질문

해결된 질문

55

semistone6239

작성한 질문수 9

0

min_value = df['views'].iloc[9]
df['views'].iloc[:10] = min_value

이 코드는 왜 안되는지 궁금합니다

df.iloc[:10,-1] = min_value

 

풀이의 이 코드는 데이터 프레임에서 슬라이싱한거고

제 코드는 시리즈 형태에서 슬라이싱한거같은데 이렇게는 안되나요

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 2

0

퇴근후딴짓

판다스에서는 그냥 불러올때는 상관 없으나
값을 변경할 때는 체이닝된 인덱싱([][] 또는 .iloc[][])보다는 단일 인덱싱(iloc[rows, cols])을 사용하는 것이 안전하고 명확합니다.

# 체이닝된 인덱싱 (값 변경 시 문제)

df['views'][0:10] = min_value

df['views'].iloc[:10] = min_value

# 단일 인덱싱 (값 변경 시 안전)

df.iloc[:10, -1] = min_value

df.loc[:9, 'views'] = min_value

0

인프런 AI 인턴

안녕하세요, 인프런 AI 인턴입니다. semistone6239님.

질문하신 코드에 대한 차이를 이해하고자 하시는 의도는 판다스를 활용한 데이터 프레임과 시리즈 객체의 슬라이싱 및 인덱싱 동작 방식 차이에 대한 것입니다. 이 점에 대해 자세히 설명 드리겠습니다.

pandas에서 DataFrame과 Series

  • df.iloc[:10, -1] = min_value는 데이터 프레임 전체에서 열을 대상으로 하여 특정 범위의 값을 지정하는 방식입니다. 이는 데이터프레임의 마지막 열(이 경우, ‘views’ 열)에 대해 처음 10개의 행을 수정하는 코드입니다.

  • df['views'].iloc[:10] = min_value는 시리즈 객체(df['views'])에서 슬라이싱을 사용하여 처음 10개의 값을 특별한 값으로 대체하는 코드입니다. 하지만 이 과정에서 주의할 점이 있습니다. 판다스의 경고에 따라, 슬라이싱된 시리즈 객체의 값을 직접 변경하는 것은 ‘SettingWithCopyWarning’ 경고를 발생시킬 수 있으며, 이는 데이터 프레임의 원본이 변경되지 않을 가능성을 암시할 수 있습니다.

문제의 원인과 해결책

  • 직접 시리즈 객체에서 값을 수정하기보다는 데이터 프레임 차원에서 접근하여 수정하는 것이 일반적으로 권장됩니다. 예를 들어, 다음과 같이 사용할 수 있습니다:
  df.loc[df.index[:10], 'views'] = min_value

이렇게 되면, 데이터프레임 df에서 ‘views’ 열의 처음 10개의 행을 안전하게 수정할 수 있습니다.

또한, 복잡한 데이터프레임 조작에서는 항상 원본 데이터가 의도하지 않게 변경되지 않았는지 확인하는 것이 중요합니다. 이러한 세부 사항을 숙지하는 것은 데이터 분석 전문가로 성장하는 데 있어 중요한 부분입니다.

기타 자세한 정보는 이 유사한 질문을 참고하세요. 여기에서 pandasilocloc 사용 방식의 차이에 대해 더 많은 내용을 확인하실 수 있습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

11회 기출 유형(작업형1) 2번 정답

0

2

1

f1 score 질문

0

2

1

10회 작업형 2 인코딩 질의

0

2

1

53번 강의에서 갑자기 수업노트가 없어졌습니다.

0

7

2

28:19 roc_auc이유

0

8

2

수강연장문의

0

11

2

전체적인 머신러닝 순서

0

7

1

빅분기 실기 유형2질문

0

13

1

ID 전처리 이유

0

25

2

데이터제공

0

21

2

예시문제 작업형3 꼬리질문2번

0

12

1

데이터 개수를 구할 때, len과 value_counts 차이

0

18

2

작업형 2 제출방

0

17

2

인코딩 스케일링 순서

0

18

2

실제 시험에서도 공식을 문제에서 주는지

0

19

2

수강 연장 문의

0

16

2

작업형2 정리한 내용 확인 부탁드립니다 ㅜㅜ

0

21

1

14강 "" 사용 관련 질문

0

22

2

캐글 제출 점수

0

26

2

기출 마무리 방법

0

50

2

빅이시 작업형2 기초 - 케이스 1~3 관련 문의

0

33

6

데이터프레임 슬라이싱 인덱싱 질문2

0

27

2

단일표본검정, 샤피로검정, 윌콕슨검정

0

38

2

강의자료 다운로드 여부

0

39

2