-
카테고리
-
세부 분야
데이터 분석
-
해결 여부
미해결
df_cafe_vs.columns 지정에 따른 그래프의 차이가 궁금합니다!
20.08.06 17:07 작성 조회수 99
1
전 강좌에서 df_cafe_vs.columns=[["구", "브랜드명", "매장수"]]로 지정을 하니
df_cafe_vs.head()로 미리보기 할 때는 df_cafe_vs.columns=["구", "브랜드명", "매장수"]와
차이가 없어 보였습니다.
하지만 sns.barplot(data=df_cafe_vs, x="구", y="매장수")로 barplot을 그리려고 하니
df_cafe_vs.columns=[["구", "브랜드명", "매장수"]]로 컬럼명을 바꿨을 때는 오류가 생기고
df_cafe_vs.columns=["구", "브랜드명", "매장수"]로 컬럼명을 바꿀 때는 오류가 생기지 않았습니다.
이 2가지의 차이가 궁금합니다! 어떤 의미가 있죠??
답변을 작성해보세요.
2
박조은
지식공유자2020.08.07
안녕하세요.
df_cafe_vs.columns 의 컬럼명을 변경하기 전에 df_cafe_vs.columns 값을 출력해 보면 판다스의 시리즈 형태로 보입니다.
판다스의 시리즈는 1차원 리스트와 유사한 구조로 되어 있는 것을 확인할 수 있습니다.
그런데 이 값을 [["구", "브랜드명", "매장수"]] 이렇게 지정해 주게 되면 2차원 행렬이 됩니다.
컬럼은 1차원 리스트, 수학적으로 표현하면 벡터 구조이기 때문에 괄호를 2개 사용하면 2차원 행렬구조이기 때문에 형태가 달라 값을 변경할 수 없습니다.
[["구", "브랜드명", "매장수"]] 이렇게 지정해 주는것은 데이터프레임에서 해당 컬럼을 가져오고자 할 때 사용합니다.
데이터프레임은 2차원 데이터프레임 구조라는 것을 떠올리면 쉽게 이해하실 수 있을거 같아요.
좋은하루 되세요!
답변 1