집계 함수에서, 동일한 컬럼의 다른 함수 적용

Question

안녕하세요.

1) 동일한 컬럼의 다른 함수 적용

titanic_df.groupby('Pclass')['Age'].agg([max, min])

2) 다른 컬럼에 다른 함수 적용

agg_format = {'Age':'max','SibSp':'sum','Fare':'mean'}

titanic_df.groupby('Pclass').agg(agg_format)

Q. 1) 2) 두가지를 동시에 할 순 없나요?

agg_format = {'Age':'max' ,'Age':'min' ,'SibSp':'sum','Fare':'mean'}

titanic_df.groupby('Pclass').agg(agg_format)

SELECT MAX(Age), MIN(Age), SUM(SibSp), AVG(Fare)

FROM TITANIC_DF

GROUP BY Pclass

처럼요. Q 결과에서는 Age 가 뒤에 위치한 Min 값으로 표현되서 Age|SibSp|Fare 세가지 컬럼만 나옵니다.

감사합니다.

Answer

안녕하십니까,

가능합니다. 'Age':['max', 'min'] 처럼 리스트로 aggregation 함수들을 선언해 주면 됩니다.

agg_format={'Age':['max','min'], 'SibSp':'sum', 'Fare':'mean'}
titanic_df.groupby('Pclass').agg(agg_format)

감사합니다.

Answer

감사합니다!!!!  [사진]