[캐글 작업형1, 12번 문제] 이해가 되지 않는게 있습니다.
[문제]
주어진 데이터에서 상위 10개 국가의 접종률 평균과 하위 10개 국가의 접종률 평균을 구하고, 그 차이를 구해보세요 . (단, 100%가 넘는 접종률 제거, 소수 첫째자리까지 출력)
import pandas as pd
df = pd.read_csv('../input/covid-vaccination-vs-death/covid-vaccination-vs-death_ratio.csv')
#시간에 따라 접종률이 점점 올라감
df2 = df.groupby('country').max()
df2 = df2.sort_values(by='ratio', ascending = False)
#100%가 넘는 접종률 제거
cond = df2['ratio'] <= 100
df2 = df2[cond]
top = df2['ratio'].head(10).mean()
bottom = df2['ratio'].tail(10).mean()
print(round(top - bottom,1))
문제와 정답코드는 위와 같이 적어주셨는데, 여기서
#시간에 따라 접종률이 점점 올라감
df2 = df.groupby('country').max()
이 말의 뜻과, 코드가 이해가 되지 않습니다.
답변 1
0
데이터를 열어보면
데이터가 누적으로(중복) 쌓이고 있어요
그러니깐
나라, 접종률, 날짜
한국 78% 어제
한국 79% 오늘
한국 80% 내일
날짜로 최신을 찾아도 되지만 가장 큰 값이 최신값이라 판단했어요!
질문 드립니다.
0
37
2
강의 내용 관련 질문드립니다~
0
34
2
수강 연장 문의
0
31
1
강의자료 일괄 다운로드
0
40
2
수강기간 연장 문의드립니다
0
27
1
list 문제 질문드립니다~
0
28
2
빅분기 실기 12회 재도전
0
39
1
강의 기간 연장 가능여부 검토 요청건
0
30
1
수강기간 연장 문의 드립니다
0
36
2
수강기간 연장 문의드립니다
0
46
2
질문이요
0
51
2
수강기간 연장 문의드립니다.
0
48
2
문제 3-2 질문드립니다
0
43
2
수강기간 연장 문의 드립니다.
0
57
2
변수, 칼럼 , df 구분
0
47
2
수강기간 연장 문의드립니다.
0
49
2
수강기간 연장 문의
0
46
2
수강기간 연장 문의드립니다.
0
40
2
수강기한 연장 문의
0
75
2
수강기간 연장 문의드립니다
0
57
2
결정트리에서 적절한 깊이 선택 후 시각화 과정에서 학습 데이터만 사용하는 이유
0
44
2
수강기간 연장 문의드립니다.
0
70
2
수강연장 문의
0
76
2
수강연장문의
0
53
2





