• 카테고리

    질문 & 답변
  • 세부 분야

    데이터 분석

  • 해결 여부

    미해결

질문드립니다!

20.10.06 18:45 작성 조회수 229

1

 안녕하세요 선생님 강의 정말 잘 듣고 있습니다! 다만 궁금한점이 한가지 있어 문의 드립니다. 

 위의 사진과 같이 pivot_table(index = "연도")만 적었을때,  컬럼으로 월, 평당분양가격만 나오는데

 왜 이 두가지만 나오는지 이해가 되지 않습니다!

 지역명, 월, 분양가격, 평당분양가격, 전용면적 모두가 나와야 하는거 아닌가용?!!

답변 1

답변을 작성해보세요.

0

안녕하세요.

pivot_table 로 피봇을 하게 되면 기본적으로 "평균"연산을 하게 되어 있어요.

shift +tab 키로 괄호 안에서 도움말을 보시면 aggfunc='mean'  값을 보실 수 있을거에요.

평균 연산을 하기 위해서는 기본적으로 수치 데이터가 아니면 연산을 할 수가 없어요.

또 pivot과 pivot_table의 가장 큰 차이점은 연산을 할 수 있냐 없냐로 나뉘게 됩니다.

그래서 평균 연산을 할 수 있는 "평당분양가격"값만 나오게 되는데요.

그럼 범주형 데이터에 대해서도 연산을 하고자 한다면 aggfunc="count" 등으로 작성해 주게 되면 범주형 데이터의 빈도수를 구할 수 있어요.

수치, 범주형 데이터 모두 연산을 하고 싶다면 

values = ["평당분양가격", "지역명"],  aggfunc= ["mean", "count"] 로 작성해 주시면 됩니다.

가끔씩 버전에 따라 aggfunc= ["mean", "count"]  이 부분이 동작하지 않기도 하는데

import numpy as np 를 하시고

aggfunc= [np.mean, np.count] 로도 구해보실 수 있습니다.