Cộng đồng Hỏi & Đáp của Inflearn
집계 함수에서, 동일한 컬럼의 다른 함수 적용
Đã giải quyết
Viết
·
267
1
안녕하세요.
1) 동일한 컬럼의 다른 함수 적용
titanic_df.groupby('Pclass')['Age'].agg([max, min])
2) 다른 컬럼에 다른 함수 적용
agg_format = {'Age':'max','SibSp':'sum','Fare':'mean'}
titanic_df.groupby('Pclass').agg(agg_format)
Q. 1) 2) 두가지를 동시에 할 순 없나요?
agg_format = {'Age':'max' ,'Age':'min' ,'SibSp':'sum','Fare':'mean'}
titanic_df.groupby('Pclass').agg(agg_format)
SELECT MAX(Age), MIN(Age), SUM(SibSp), AVG(Fare)
FROM TITANIC_DF
GROUP BY Pclass
처럼요. Q 결과에서는 Age 가 뒤에 위치한 Min 값으로 표현되서 Age|SibSp|Fare 세가지 컬럼만 나옵니다.
감사합니다.
Quiz
머신러닝과 전통적인 프로그래밍의 근본적인 차이는 무엇일까요?
데이터 처리 속도
문제 해결 논리를 사람이 직접 정의하는지 데이터에서 학습하는지 여부
사용하는 프로그래밍 언어
결과의 정확성
Câu trả lời 2
1
안녕하십니까,
가능합니다. 'Age':['max', 'min'] 처럼 리스트로 aggregation 함수들을 선언해 주면 됩니다.
agg_format={'Age':['max','min'], 'SibSp':'sum', 'Fare':'mean'}
titanic_df.groupby('Pclass').agg(agg_format)
감사합니다.
0





