인프런 커뮤니티 질문&답변

성욱님의 프로필 이미지
성욱

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

[캐글 작업형1, 12번 문제] 이해가 되지 않는게 있습니다.

해결된 질문

작성

·

95

·

수정됨

0

[문제]

주어진 데이터에서 상위 10개 국가의 접종률 평균과 하위 10개 국가의 접종률 평균을 구하고, 그 차이를 구해보세요 . (단, 100%가 넘는 접종률 제거, 소수 첫째자리까지 출력)

 

import pandas as pd

df = pd.read_csv('../input/covid-vaccination-vs-death/covid-vaccination-vs-death_ratio.csv')

 

#시간에 따라 접종률이 점점 올라감

df2 = df.groupby('country').max()

df2 = df2.sort_values(by='ratio', ascending = False)

 

#100%가 넘는 접종률 제거

cond = df2['ratio'] <= 100

df2 = df2[cond]

 

top = df2['ratio'].head(10).mean()

bottom = df2['ratio'].tail(10).mean()

print(round(top - bottom,1))

 

문제와 정답코드는 위와 같이 적어주셨는데, 여기서

 

#시간에 따라 접종률이 점점 올라감

df2 = df.groupby('country').max()

이 말의 뜻과, 코드가 이해가 되지 않습니다.

답변 1

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

데이터를 열어보면

데이터가 누적으로(중복) 쌓이고 있어요

그러니깐

나라, 접종률, 날짜

한국 78% 어제

한국 79% 오늘

한국 80% 내일

날짜로 최신을 찾아도 되지만 가장 큰 값이 최신값이라 판단했어요!

성욱님의 프로필 이미지
성욱

작성한 질문수

질문하기