4/9 groupby 와 pivot_table 에서 질문입니다.
306
작성한 질문수 4
df_cafe_vs=df_cafe.groupby(["시군구명","브랜드명"])["상호명"].count()
1번 질문.
df_cafe_vs.columns 를 하면 아래의 에러 메세지가 뜨는데, 'Series' object has no attribute 'columns'
df_cafe_vs.columns=["구", "브랜드명", "매장수"]
df_cafe_vs.columns
에서는 아래와 같이 잘 되는지 잘 모르겠습니다.
['구', '브랜드명', '매장수']
2. df_cafe_vs.to_frame() 한 데이터에서는 column값이 상호명 하나라고 나오고
위에서 처럼 ["구", "브랜드명", "매장수"] 바꿔주는 거 하니 오류가 납니다.
답변 1
0
안녕하세요.
1번 내용에 대해서는 아래의 코드를 실행했을 때 결과는 멀티인덱스를 가지는 시리즈 형태로 반환이 됩니다.
df_cafe_vs=df_cafe.groupby(["시군구명","브랜드명"])["상호명"].count()
컬럼명을 지정해 주면 컬럼이 지정이 되긴 하지만 해당 변수를 다시 출력했을 때는 컬럼이 보이지 않을거에요.
위 결과는 멀티인덱스를 가지는 Series 형태라서 그래요.
해당 인덱스 값을 컬럼으로 변경하면 데이터 프레임으로 변경이 되는데
df_cafe.groupby(["시군구명","브랜드명"])["상호명"].count().reset_index()
로 인덱스를 초기화 해주고 컬럼명을 변경해 주는 방법을 추천합니다.
reset_index()를 통해 인덱스를 초기화 하면 기존 인덱스가 컬럼이 되고 인덱스 번호가 새로 생성됩니다.
2번은 to_frame()을 했을 때 데이터 프레임으로 반환이 되나 인덱스는 기존 멀티인덱스 값이 그대로 들어가게 됩니다. 인덱스 값을 컬럼으로 사용하고 싶다면 reset_index()를 사용하는 것을 추천하지만 시리즈형태의 데이터를 데이터프레임 형태로 변환하고자 한다면 to_frame()을 사용하시는 것을 추천합니다.
기존 인덱스 값을 컬럼으로 만들 것이냐 아니면 인덱스값으로 사용할 것이냐의 차이로 두 방법를 선택해서 활용해 보시면 될것 같아요.
감사합니다 :)
패키지 설치 에러 ydata-profiling
0
134
2
자세한 설명 부탁드려요 ㅜ
0
200
2
seaborn 라이브러리 호출하였으나 그래프가 안 그려져요
0
310
2
value_counts와 count 차이
0
385
2
안녕하세요 데이터 최신과 관련해서 문의드립니다.
0
218
3
scatterplot질문
0
133
1
강의 화면이 안나옵니다
0
174
2
4분12초 2013년부터 데이터가 없으면 어떻게하나요?..
0
194
2
에러 메시지
1
311
2
그래프 색이 동일하게 나옵니다.
0
328
2
시각화 라이브러리 비교
0
401
2
주피터 노트북 설치
0
399
1
2. 상가 기술통계 아웃풋 자료에서 오류가 납니다
0
234
1
14. distplot g = sns.FacetGrid(df_last, row="지역명", height=1.7, aspect=4) g.map(sns.distplot, "평당분양가격", hist=False, rug=True); 오류
0
185
1
group by agg function failed 에러
0
697
2
빈도수가 1000개 이상인 데이터를 따로 담을 때 코드 질문 있습니다.
0
296
2
주피터 노트북 실행 했는데 앞에 *가 생기고 결과가 나오지 않아요
0
373
3
get_string함수에서 문자 'nan'
0
205
1
seaborn X축 시작 지점 조정 질의의 건
0
229
1
14강 distplot 질의
0
300
1
nbextension 설치 및 셋팅 후 적용이 안되는 이슈
0
488
1
corr = df.corr() 입력시 오류
1
384
1
keyword grid_b is not recognized
0
342
1
%ls data 매직커맨드 사용시 한글 깨짐
0
305
1





