inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

공공데이터로 파이썬 데이터 분석 시작하기

4/9 groupby 와 pivot_table 에서 질문입니다.

306

jinhijinhi

작성한 질문수 4

1

df_cafe_vs=df_cafe.groupby(["시군구명","브랜드명"])["상호명"].count() 

1번 질문.

df_cafe_vs.columns 를 하면  아래의 에러 메세지가 뜨는데,  'Series' object has no attribute 'columns'

df_cafe_vs.columns=["구", "브랜드명", "매장수"]

df_cafe_vs.columns

에서는 아래와 같이 잘 되는지 잘 모르겠습니다.

 ['구', '브랜드명', '매장수']



2. df_cafe_vs.to_frame() 한 데이터에서는 column값이 상호명 하나라고 나오고

위에서 처럼 ["구", "브랜드명", "매장수"] 바꿔주는 거 하니 오류가 납니다. 

pandas python numpy

답변 1

0

박조은

안녕하세요.

1번 내용에 대해서는 아래의 코드를 실행했을 때 결과는 멀티인덱스를 가지는 시리즈 형태로 반환이 됩니다.

df_cafe_vs=df_cafe.groupby(["시군구명","브랜드명"])["상호명"].count() 

컬럼명을 지정해 주면 컬럼이 지정이 되긴 하지만 해당 변수를 다시 출력했을 때는 컬럼이 보이지 않을거에요.

위 결과는 멀티인덱스를 가지는 Series 형태라서 그래요. 

해당 인덱스 값을 컬럼으로 변경하면 데이터 프레임으로 변경이 되는데

df_cafe.groupby(["시군구명","브랜드명"])["상호명"].count().reset_index() 

로 인덱스를 초기화 해주고 컬럼명을 변경해 주는 방법을 추천합니다.

reset_index()를 통해 인덱스를 초기화 하면 기존 인덱스가 컬럼이 되고 인덱스 번호가 새로 생성됩니다.

2번은 to_frame()을 했을 때 데이터 프레임으로 반환이 되나 인덱스는 기존 멀티인덱스 값이 그대로 들어가게 됩니다. 인덱스 값을 컬럼으로 사용하고 싶다면 reset_index()를 사용하는 것을 추천하지만 시리즈형태의 데이터를 데이터프레임 형태로 변환하고자 한다면 to_frame()을 사용하시는 것을 추천합니다.

기존 인덱스 값을 컬럼으로 만들 것이냐 아니면 인덱스값으로 사용할 것이냐의 차이로 두 방법를 선택해서 활용해 보시면 될것 같아요.

감사합니다 :)

패키지 설치 에러 ydata-profiling

0

134

2

자세한 설명 부탁드려요 ㅜ

0

200

2

seaborn 라이브러리 호출하였으나 그래프가 안 그려져요

0

310

2

value_counts와 count 차이

0

385

2

안녕하세요 데이터 최신과 관련해서 문의드립니다.

0

218

3

scatterplot질문

0

133

1

강의 화면이 안나옵니다

0

174

2

4분12초 2013년부터 데이터가 없으면 어떻게하나요?..

0

194

2

에러 메시지

1

311

2

그래프 색이 동일하게 나옵니다.

0

328

2

시각화 라이브러리 비교

0

401

2

주피터 노트북 설치

0

399

1

2. 상가 기술통계 아웃풋 자료에서 오류가 납니다

0

234

1

14. distplot g = sns.FacetGrid(df_last, row="지역명", height=1.7, aspect=4) g.map(sns.distplot, "평당분양가격", hist=False, rug=True); 오류

0

185

1

group by agg function failed 에러

0

697

2

빈도수가 1000개 이상인 데이터를 따로 담을 때 코드 질문 있습니다.

0

296

2

주피터 노트북 실행 했는데 앞에 *가 생기고 결과가 나오지 않아요

0

373

3

get_string함수에서 문자 'nan'

0

205

1

seaborn X축 시작 지점 조정 질의의 건

0

229

1

14강 distplot 질의

0

300

1

nbextension 설치 및 셋팅 후 적용이 안되는 이슈

0

488

1

corr = df.corr() 입력시 오류

1

384

1

keyword grid_b is not recognized

0

342

1

%ls data 매직커맨드 사용시 한글 깨짐

0

305

1