• 카테고리

    질문 & 답변
  • 세부 분야

    자격증 (데이터 사이언스)

  • 해결 여부

    해결됨

그룹바이 관련해서 질문드립니다!!

23.11.04 10:05 작성 조회수 139

0

안녕하세요 선생님 문제를 풀다가 궁금한게 생겨서 질문드립니다.

1. .주어진 전체 기간의 각 나라별 골득점수 상위 5개 국가와 그 득점수를 데이터프레임형태로 출력하라

df.groupby('Country')['Goals'].sum().sort_values(ascending = False).head(5).to_frame()

2. Iris 데이터 세트에서 species 변수 값별로 petal_length 상위 10개행의 평균값을 구한 후 , 평균 값의 합을 계산해라 최종값은 소수점 이하 반올림

df.sort_values(['species', 'petal_length'], ascending = False).groupby('species').head(10).groupby('species')['petal_length'].mean().sum()

1번에서는 나라별 골득점수를 그룹바이 한 다음에 상위 5개를 출력했는데 2번에서는 먼저 내림차순으로 정렬을 하고 그룹바이를 하더라고요

1번처럼 이런식으로 해야 하는거 아닌가요? 둘의 차이점이 궁금합니다!!

df.groupby('species')['petal_length'].mean().sort_values(ascending = False).head(5)

답변 1

답변을 작성해보세요.

0

구하는 방법은 여러개입니다

어떤식으로던 데이터가 정리되고 답을 구하면 될 것 같습니다 🙌🙌

데이터가 없어 정확한 확인이 어렵습니다

 

한 줄에 붙여서 적는 것은

입문자에게 권장하진 않습니다

실수하지 않도록 가급적 함수별로 실행하고

결과를 확인한 후 뒤에 작업을 추천드려요💪

김석종님의 프로필

김석종

질문자

2023.11.04

네 선생님 감사합니다!!