inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

공공데이터로 파이썬 데이터 분석 시작하기

[9/15] 구별 음식점 분석으로 서브셋 만들기 - boolean Indexing 이해하기

copy() 사용에 관한 질문

168

david_kim90

작성한 질문수 6

1

안녕하세요, 강의 너무 재밌게 잘 듣고 있습니다.

아직 .copy() 메서드에 대한 개념이 잘 다가오지 않는데, food_gu에는 따로 .copy()를 사용하지 않아도 df_seoul_food 변수가 그대로 유지가 되나요?

numpy pandas python

답변 1

1

박조은

안녕하세요. 

food_gu 에 새로운 변수를 추가한다든지 내부에서 연산을 해서 파생변수를 만든다든지 하면 warning 메시지가 뜰 수 있습니다.

단순히 분석을 하고 다른 목적으로 사용하지 않을 변수라면 .copy()를 해주지 않아도 상관이 없어요.

여기에서는 파생변수를 따로 만들지 않고 요약만 했기 때문에 원본에는 영향을 주지 않습니다.

하지만 원본에 영향을 주지 않고 새로운 데이터프레임을 만들어 파생변수도 만들고 데이터프레임을 변형하고자 한다면 .copy()를 통해 Deep Copy를 해주는게 좋아요.

그리고 챕터5에서는 .copy를 하지 않고 변수에 담은 내용은 조작해서 다시 원본에 적용하는 과정이 나오는데요.

서브셋을 만들고 거기에 만든 파생변수를 원본에 적용하고자 한다면 .copy()를 사용하지 않아야 원본에 적용이 됩니다.

따라서 .copy()라는 건 목적에 맞게 원본에 영향을 줄 것이냐 말것이냐로 결정해서 사용하시면 됩니다.

패키지 설치 에러 ydata-profiling

0

121

2

자세한 설명 부탁드려요 ㅜ

0

177

2

seaborn 라이브러리 호출하였으나 그래프가 안 그려져요

0

288

2

value_counts와 count 차이

0

343

2

안녕하세요 데이터 최신과 관련해서 문의드립니다.

0

205

3

scatterplot질문

0

122

1

강의 화면이 안나옵니다

0

164

2

4분12초 2013년부터 데이터가 없으면 어떻게하나요?..

0

188

2

에러 메시지

1

303

2

그래프 색이 동일하게 나옵니다.

0

309

2

시각화 라이브러리 비교

0

384

2

주피터 노트북 설치

0

390

1

2. 상가 기술통계 아웃풋 자료에서 오류가 납니다

0

226

1

14. distplot g = sns.FacetGrid(df_last, row="지역명", height=1.7, aspect=4) g.map(sns.distplot, "평당분양가격", hist=False, rug=True); 오류

0

178

1

group by agg function failed 에러

0

687

2

빈도수가 1000개 이상인 데이터를 따로 담을 때 코드 질문 있습니다.

0

288

2

주피터 노트북 실행 했는데 앞에 *가 생기고 결과가 나오지 않아요

0

363

3

get_string함수에서 문자 'nan'

0

200

1

seaborn X축 시작 지점 조정 질의의 건

0

213

1

14강 distplot 질의

0

289

1

nbextension 설치 및 셋팅 후 적용이 안되는 이슈

0

478

1

corr = df.corr() 입력시 오류

1

373

1

keyword grid_b is not recognized

0

336

1

%ls data 매직커맨드 사용시 한글 깨짐

0

293

1