• 카테고리

    질문 & 답변
  • 세부 분야

    딥러닝 · 머신러닝

  • 해결 여부

    해결됨

집계 함수에서, 동일한 컬럼의 다른 함수 적용

20.02.04 10:23 작성 조회수 115

1

안녕하세요.

1) 동일한 컬럼의 다른 함수 적용

titanic_df.groupby('Pclass')['Age'].agg([max, min])

2) 다른 컬럼에 다른 함수 적용

agg_format = {'Age':'max','SibSp':'sum','Fare':'mean'}

titanic_df.groupby('Pclass').agg(agg_format)

Q. 1) 2) 두가지를 동시에 할 순 없나요?

agg_format = {'Age':'max'   ,'Age':'min'   ,'SibSp':'sum','Fare':'mean'}

titanic_df.groupby('Pclass').agg(agg_format)

SELECT MAX(Age), MIN(Age), SUM(SibSp), AVG(Fare)

  FROM TITANIC_DF

 GROUP BY Pclass

처럼요. Q 결과에서는 Age 가 뒤에 위치한 Min 값으로 표현되서 Age|SibSp|Fare 세가지 컬럼만 나옵니다.

감사합니다.

답변 2

·

답변을 작성해보세요.

1

안녕하십니까,

가능합니다. 'Age':['max', 'min'] 처럼 리스트로 aggregation 함수들을 선언해 주면 됩니다.

agg_format={'Age':['max','min'], 'SibSp':'sum', 'Fare':'mean'}
titanic_df.groupby('Pclass').agg(agg_format)

감사합니다.

0

김상화님의 프로필

김상화

질문자

2020.02.04

감사합니다!!!!