• 카테고리

    질문 & 답변
  • 세부 분야

    데이터 분석

  • 해결 여부

    미해결

df_cafe_vs.columns 지정에 따른 그래프의 차이가 궁금합니다!

20.08.06 17:07 작성 조회수 99

1

전 강좌에서 df_cafe_vs.columns=[["구", "브랜드명", "매장수"]]로 지정을 하니
df_cafe_vs.head()로 미리보기 할 때는 df_cafe_vs.columns=["구", "브랜드명", "매장수"]와
차이가 없어 보였습니다.

하지만 sns.barplot(data=df_cafe_vs, x="구", y="매장수")로 barplot을 그리려고 하니
df_cafe_vs.columns=[["구", "브랜드명", "매장수"]]로 컬럼명을 바꿨을 때는 오류가 생기고
df_cafe_vs.columns=["구", "브랜드명", "매장수"]로 컬럼명을 바꿀 때는 오류가 생기지 않았습니다.

이 2가지의 차이가 궁금합니다! 어떤 의미가 있죠??

답변 1

답변을 작성해보세요.

2

안녕하세요.

df_cafe_vs.columns 의 컬럼명을 변경하기 전에 df_cafe_vs.columns 값을 출력해 보면 판다스의 시리즈 형태로 보입니다.

판다스의 시리즈는 1차원 리스트와 유사한 구조로 되어 있는 것을 확인할 수 있습니다.

그런데 이 값을 [["구", "브랜드명", "매장수"]] 이렇게 지정해 주게 되면 2차원 행렬이 됩니다.

컬럼은 1차원 리스트, 수학적으로 표현하면 벡터 구조이기 때문에 괄호를 2개 사용하면 2차원 행렬구조이기 때문에 형태가 달라 값을 변경할 수 없습니다.

[["구", "브랜드명", "매장수"]] 이렇게 지정해 주는것은 데이터프레임에서 해당 컬럼을 가져오고자 할 때  사용합니다.

데이터프레임은 2차원 데이터프레임 구조라는 것을 떠올리면 쉽게 이해하실 수 있을거 같아요.

좋은하루 되세요!