inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

작업형1 모의고사 풀어보기

캐글 T1-12에서 접종률 100% 이상 데이터 먼저 삭제하지 않는 이유

해결된 질문

169

soyoung an

작성한 질문수 22

0

아래 문제에서 100% 넘는 접종률을 먼저 삭제하지 않고, 문제에서 언급한 순서대로 풀이해야 하나요??

your code 부분에 적은대로 풀이를 하면 답이 다른데 이대로 풀면 안되는 이유가 궁금합니다!

 

문제 : 주어진 데이터에서 상위 10개 국가의 접종률 평균과 하위 10개 국가의 접종률 평균을 구하고, 그 차이를 구해보세요

# your code
# 100%가 넘는 접종률 제거
cond = df["ratio"] <= 100

# 상위 10개 국가의 접종률 평균과 하위 10개 국가의 접종률 평균을 구하고, 
df = df[cond]
df = df.sort_values("ratio", ascending = False)
top10 = df["ratio"].head(10).mean()
bottom10 = df["ratio"].tail(10).mean()

# 그 차이를 구해보세요(소수 첫째자리까지 출력)
print(round(top10 - bottom10,1))

 

풀이

df2 = df.groupby('country').max() #시간에 따라 접종률이 점점 올라감
df2 = df2.sort_values(by='ratio', ascending = False)

#100%가 넘는 접종률 제거
cond = df2['ratio'] <= 100
df2 = df2[cond]

top = df2['ratio'].head(10).mean()
bottom = df2['ratio'].tail(10).mean()

print(round(top - bottom,1))

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 2

0

퇴근후딴짓

같은 나라 데이터가 계속 등록되었어요

image

0

퇴근후딴짓

시간에 따라 접종률이 점점 올라가서

최고 값이 국가별 마지막(최종) 값이라고 판단해서 max()가 있습니다.

데이터를 열어보면 한 국가에 여러 데이터가 있어서 아래 풀이는 이전데이터도 포함되어있어요!

질문 드립니다.

0

37

2

강의 내용 관련 질문드립니다~

0

34

2

수강 연장 문의

0

31

1

강의자료 일괄 다운로드

0

41

2

수강기간 연장 문의드립니다

0

28

1

list 문제 질문드립니다~

0

28

2

빅분기 실기 12회 재도전

0

39

1

강의 기간 연장 가능여부 검토 요청건

0

30

1

수강기간 연장 문의 드립니다

0

36

2

수강기간 연장 문의드립니다

0

47

2

질문이요

0

51

2

수강기간 연장 문의드립니다.

0

49

2

문제 3-2 질문드립니다

0

43

2

수강기간 연장 문의 드립니다.

0

58

2

변수, 칼럼 , df 구분

0

48

2

수강기간 연장 문의드립니다.

0

49

2

수강기간 연장 문의

0

46

2

수강기간 연장 문의드립니다.

0

40

2

수강기한 연장 문의

0

76

2

수강기간 연장 문의드립니다

0

57

2

결정트리에서 적절한 깊이 선택 후 시각화 과정에서 학습 데이터만 사용하는 이유

0

44

2

수강기간 연장 문의드립니다.

0

70

2

수강연장 문의

0

76

2

수강연장문의

0

53

2