강의

멘토링

커뮤니티

인프런 커뮤니티 질문&답변

bbh9955님의 프로필 이미지
bbh9955

작성한 질문수

공공데이터로 파이썬 데이터 분석 시작하기

[5/9] groupby와 pivot_table 반환값으로 시각화 차이 이해하기

df_cafe_vs.columns 지정에 따른 그래프의 차이가 궁금합니다!

작성

·

194

1

전 강좌에서 df_cafe_vs.columns=[["구", "브랜드명", "매장수"]]로 지정을 하니
df_cafe_vs.head()로 미리보기 할 때는 df_cafe_vs.columns=["구", "브랜드명", "매장수"]와
차이가 없어 보였습니다.

하지만 sns.barplot(data=df_cafe_vs, x="구", y="매장수")로 barplot을 그리려고 하니
df_cafe_vs.columns=[["구", "브랜드명", "매장수"]]로 컬럼명을 바꿨을 때는 오류가 생기고
df_cafe_vs.columns=["구", "브랜드명", "매장수"]로 컬럼명을 바꿀 때는 오류가 생기지 않았습니다.

이 2가지의 차이가 궁금합니다! 어떤 의미가 있죠??

답변 1

2

박조은님의 프로필 이미지
박조은
지식공유자

안녕하세요.

df_cafe_vs.columns 의 컬럼명을 변경하기 전에 df_cafe_vs.columns 값을 출력해 보면 판다스의 시리즈 형태로 보입니다.

판다스의 시리즈는 1차원 리스트와 유사한 구조로 되어 있는 것을 확인할 수 있습니다.

그런데 이 값을 [["구", "브랜드명", "매장수"]] 이렇게 지정해 주게 되면 2차원 행렬이 됩니다.

컬럼은 1차원 리스트, 수학적으로 표현하면 벡터 구조이기 때문에 괄호를 2개 사용하면 2차원 행렬구조이기 때문에 형태가 달라 값을 변경할 수 없습니다.

[["구", "브랜드명", "매장수"]] 이렇게 지정해 주는것은 데이터프레임에서 해당 컬럼을 가져오고자 할 때  사용합니다.

데이터프레임은 2차원 데이터프레임 구조라는 것을 떠올리면 쉽게 이해하실 수 있을거 같아요.

좋은하루 되세요!

bbh9955님의 프로필 이미지
bbh9955

작성한 질문수

질문하기