inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

[캐글 작업형1, 12번 문제] 이해가 되지 않는게 있습니다.

해결된 질문

138

성욱

작성한 질문수 18

0

[문제]

주어진 데이터에서 상위 10개 국가의 접종률 평균과 하위 10개 국가의 접종률 평균을 구하고, 그 차이를 구해보세요 . (단, 100%가 넘는 접종률 제거, 소수 첫째자리까지 출력)

 

import pandas as pd

df = pd.read_csv('../input/covid-vaccination-vs-death/covid-vaccination-vs-death_ratio.csv')

 

#시간에 따라 접종률이 점점 올라감

df2 = df.groupby('country').max()

df2 = df2.sort_values(by='ratio', ascending = False)

 

#100%가 넘는 접종률 제거

cond = df2['ratio'] <= 100

df2 = df2[cond]

 

top = df2['ratio'].head(10).mean()

bottom = df2['ratio'].tail(10).mean()

print(round(top - bottom,1))

 

문제와 정답코드는 위와 같이 적어주셨는데, 여기서

 

#시간에 따라 접종률이 점점 올라감

df2 = df.groupby('country').max()

이 말의 뜻과, 코드가 이해가 되지 않습니다.

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 1

0

퇴근후딴짓

데이터를 열어보면

데이터가 누적으로(중복) 쌓이고 있어요

그러니깐

나라, 접종률, 날짜

한국 78% 어제

한국 79% 오늘

한국 80% 내일

날짜로 최신을 찾아도 되지만 가장 큰 값이 최신값이라 판단했어요!

질문 드립니다.

0

37

2

강의 내용 관련 질문드립니다~

0

34

2

수강 연장 문의

0

31

1

강의자료 일괄 다운로드

0

41

2

수강기간 연장 문의드립니다

0

28

1

list 문제 질문드립니다~

0

28

2

빅분기 실기 12회 재도전

0

39

1

강의 기간 연장 가능여부 검토 요청건

0

30

1

수강기간 연장 문의 드립니다

0

36

2

수강기간 연장 문의드립니다

0

47

2

질문이요

0

51

2

수강기간 연장 문의드립니다.

0

48

2

문제 3-2 질문드립니다

0

43

2

수강기간 연장 문의 드립니다.

0

58

2

변수, 칼럼 , df 구분

0

47

2

수강기간 연장 문의드립니다.

0

49

2

수강기간 연장 문의

0

46

2

수강기간 연장 문의드립니다.

0

40

2

수강기한 연장 문의

0

75

2

수강기간 연장 문의드립니다

0

57

2

결정트리에서 적절한 깊이 선택 후 시각화 과정에서 학습 데이터만 사용하는 이유

0

44

2

수강기간 연장 문의드립니다.

0

70

2

수강연장 문의

0

76

2

수강연장문의

0

53

2