Written on
·
311
1
안녕하세요 선생님 강의 정말 잘 듣고 있습니다! 다만 궁금한점이 한가지 있어 문의 드립니다.
위의 사진과 같이 pivot_table(index = "연도")만 적었을때, 컬럼으로 월, 평당분양가격만 나오는데
왜 이 두가지만 나오는지 이해가 되지 않습니다!
지역명, 월, 분양가격, 평당분양가격, 전용면적 모두가 나와야 하는거 아닌가용?!!
Answer 1
0
안녕하세요.
pivot_table 로 피봇을 하게 되면 기본적으로 "평균"연산을 하게 되어 있어요.
shift +tab 키로 괄호 안에서 도움말을 보시면 aggfunc='mean' 값을 보실 수 있을거에요.
평균 연산을 하기 위해서는 기본적으로 수치 데이터가 아니면 연산을 할 수가 없어요.
또 pivot과 pivot_table의 가장 큰 차이점은 연산을 할 수 있냐 없냐로 나뉘게 됩니다.
그래서 평균 연산을 할 수 있는 "평당분양가격"값만 나오게 되는데요.
그럼 범주형 데이터에 대해서도 연산을 하고자 한다면 aggfunc="count" 등으로 작성해 주게 되면 범주형 데이터의 빈도수를 구할 수 있어요.
수치, 범주형 데이터 모두 연산을 하고 싶다면
values = ["평당분양가격", "지역명"], aggfunc= ["mean", "count"] 로 작성해 주시면 됩니다.
가끔씩 버전에 따라 aggfunc= ["mean", "count"] 이 부분이 동작하지 않기도 하는데
import numpy as np 를 하시고
aggfunc= [np.mean, np.count] 로도 구해보실 수 있습니다.