inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

(삭제 예정, 구 버전) 작업형1 모의고사 풀어보기

캐글 T1-12에서 접종률 100% 이상 데이터 먼저 삭제하지 않는 이유

해결된 질문

179

soyoung an

작성한 질문수 22

0

아래 문제에서 100% 넘는 접종률을 먼저 삭제하지 않고, 문제에서 언급한 순서대로 풀이해야 하나요??

your code 부분에 적은대로 풀이를 하면 답이 다른데 이대로 풀면 안되는 이유가 궁금합니다!

 

문제 : 주어진 데이터에서 상위 10개 국가의 접종률 평균과 하위 10개 국가의 접종률 평균을 구하고, 그 차이를 구해보세요

# your code
# 100%가 넘는 접종률 제거
cond = df["ratio"] <= 100

# 상위 10개 국가의 접종률 평균과 하위 10개 국가의 접종률 평균을 구하고, 
df = df[cond]
df = df.sort_values("ratio", ascending = False)
top10 = df["ratio"].head(10).mean()
bottom10 = df["ratio"].tail(10).mean()

# 그 차이를 구해보세요(소수 첫째자리까지 출력)
print(round(top10 - bottom10,1))

 

풀이

df2 = df.groupby('country').max() #시간에 따라 접종률이 점점 올라감
df2 = df2.sort_values(by='ratio', ascending = False)

#100%가 넘는 접종률 제거
cond = df2['ratio'] <= 100
df2 = df2[cond]

top = df2['ratio'].head(10).mean()
bottom = df2['ratio'].tail(10).mean()

print(round(top - bottom,1))

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 2

0

퇴근후딴짓

같은 나라 데이터가 계속 등록되었어요

image

0

퇴근후딴짓

시간에 따라 접종률이 점점 올라가서

최고 값이 국가별 마지막(최종) 값이라고 판단해서 max()가 있습니다.

데이터를 열어보면 한 국가에 여러 데이터가 있어서 아래 풀이는 이전데이터도 포함되어있어요!

원핫인코딩과 레이블 인코딩에서 concat

0

3

1

제2유형 질문입니다.

0

19

2

C()

0

16

2

작업형 2에서 strafity 적용 유무

0

21

2

수강 기간 연장 가능 여부 문의드립니다.

0

17

1

ols

0

20

2

2유형 작성관련 질문(일반 심화)

0

21

2

2유형 작성관련 질문

0

18

2

2유형 object컬럼 개수 다르면

0

20

2

코딩팡질문이요ㅠㅠ

0

22

2

관찰값과 기대값의 개념이 헷갈립니다.

0

13

2

작업형2 ID 컬럼 삭제 질문

0

23

2

2유형 작성관련 질문

0

20

2

memoryerror 질문

0

18

2

작업형 유형2 이렇게 고정 템플릿으로 가져가도 될까요?

0

21

1

ID 삭제 필수 인가요?

0

19

3

7회 기출문제 작업형1번 df 변환 후 저장되는 방식 질문

0

16

2

3 유형 귀무가설, 대립가설

0

20

2

인코딩 관련 질문 있습니다

0

24

2

작업형3 이원분산분석 sm에서불러오기 / anova_lm 차이

0

27

2

2유형 원핫인코딩 오류

0

23

2

시험장에서 주석 단축키 안될 때 많나요?

0

29

2

라벨인코딩 방식

0

29

2

test 재학습 관련

0

16

2