inflearn logo
강의

講義

知識共有

[仕事終わりの趣味] ビッグデータ分析実技 (作業型1,2,3)

Pandas 5 - グルーピング、結合、ピボットテーブル

14강 "" 사용 관련 질문

解決済みの質問

4

012huuu

投稿した質問数 2

0

# 하나의 열에 대해 여러 집계 함수를 동시에 적용
pt = df.pivot_table(
    index=['구분', '크기'],
    values=['수량', '금액'],
    aggfunc={'수량': "mean", '금액': ["min", "max", "mean"]}
)
pt

이 부분에서,

python 머신러닝 빅데이터 pandas 빅데이터분석기사

回答 2

0

roadmap

개발자들은 개발할 때 공식 문서를 따릅니다. 만든 사람이 알려준 대로 사용하기 위함이에요.

pandas 공식 문서에 "mean", "min", "max" 처럼 문자열("") 형태로 작성되어 있으므로, 공식 문서 스타일을 따라 작업하고 있습니다!
공식문서 위치
https://pandas.pydata.org/docs/reference/api/pandas.pivot_table.html

0

communityai8509

안녕하세요, 인프런 AI 인턴입니다. 012huuu님.

질문해 주신 파이썬에서의 각종 집계 함수(min, max, mean 등)를 pivot_table 함수에서 문자열 형식으로 사용해야 하는 이유에 대해 설명드리겠습니다.

pivot_table에서 문자열 사용 이유

  1. 평균적 함수 호출 방식:

    • 파이썬의 pandas에서 pivot_table, groupby 함수는 여러 집계 함수(aggregation function)를 지원합니다. 이 함수들은 인수로 직접 이름을 문자열로 받는 경우가 명시적 호출 방식입니다.
    • 예를 들어, aggfunc='mean' 대신 직접 함수를 참조하려면 aggfunc=np.mean 같은 형태로 사용하기도 합니다. 그러나 문자열로 지정하는 경우가 더 일반적이고 직관적입니다.
  2. 다양한 방식 허용:

    • pivot_table 메서드는 동일한 형식인 문자열, 함수 이름 모두 수용할 수 있게 설계되었습니다. 이는 코드를 좀 더 읽기 쉽게 하고, 사용자가 파이썬이나 pandas에 덜 익숙해도 자연스럽게 접근할 수 있도록 돕습니다.
  3. 복잡한 함수 지정:

    • 문자열로 지정하는 경우는 일반적으로 pandas에서 기본적으로 제공하는 간단한 함수들에 한해 사용되며, 복잡한 사용자 정의 함수를 사용해야 하는 경우에는 직접 함수 객체를 참조하여 지정합니다.

관련 자료

  • pandas Pivot Table: pandas 공식 문서에서 pivot_table 사용 방법을 더 자세히 살펴보실 수 있습니다.

이해를 돕기 위해 위 설명을 제공해드렸습니다. 위 설명과 함께 코드를 보시면, pandaspivot_table 기능을 더욱 쉽게 이해하실 수 있을 것입니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

캐글 제출 점수

0

12

2

기출 마무리 방법

0

28

2

빅이시 작업형2 기초 - 케이스 1~3 관련 문의

0

16

2

데이터프레임 슬라이싱 인덱싱 질문2

0

18

2

단일표본검정, 샤피로검정, 윌콕슨검정

0

27

2

강의자료 다운로드 여부

0

29

2

문제에 첨부된 예시와 실제 출력된 샘플 비교

0

24

2

원핫 인코딩 관련

0

33

2

타겟 분리

0

29

2

Id 삭제

0

32

2

roc_auc_score 질문: 작업형2 모의문제3 09분 48초

0

31

2

원핫인코딩 코드 질문

0

30

2

map 함수 사용 필수적인가요

0

40

2

수강 기한 연장 문의드립니다.

0

43

2

34강 평가지표

0

35

2

103강 작업2형 전처리(레이블인코딩 부분) 오류

0

26

3

작업형1_section14 문의

0

23

2

작업형1_연습문제 7번 관련입니다.

0

27

2

데이터 프레임 슬라이싱 혹은 데이터 선택하기가 어렵습니다.

0

25

2

크로스 밸리데이션 질문

0

32

2

로지스틱 회귀분석 질문

0

30

2

수치형 데이터만 선택하여 푸는 경우에 오답확률이 높아질까요?

0

32

2

2유형 object 컬럼 인코딩 관련 질문

0

47

2

하이퍼파라미터 변수

0

38

2