캐글 T1-12에서 접종률 100% 이상 데이터 먼저 삭제하지 않는 이유
아래 문제에서 100% 넘는 접종률을 먼저 삭제하지 않고, 문제에서 언급한 순서대로 풀이해야 하나요??
your code 부분에 적은대로 풀이를 하면 답이 다른데 이대로 풀면 안되는 이유가 궁금합니다!
문제 : 주어진 데이터에서 상위 10개 국가의 접종률 평균과 하위 10개 국가의 접종률 평균을 구하고, 그 차이를 구해보세요
(단, 100%가 넘는 접종률 제거, 소수 첫째자리까지 출력)
# your code
# 100%가 넘는 접종률 제거
cond = df["ratio"] <= 100
# 상위 10개 국가의 접종률 평균과 하위 10개 국가의 접종률 평균을 구하고,
df = df[cond]
df = df.sort_values("ratio", ascending = False)
top10 = df["ratio"].head(10).mean()
bottom10 = df["ratio"].tail(10).mean()
# 그 차이를 구해보세요(소수 첫째자리까지 출력)
print(round(top10 - bottom10,1))
풀이
df2 = df.groupby('country').max() #시간에 따라 접종률이 점점 올라감
df2 = df2.sort_values(by='ratio', ascending = False)
#100%가 넘는 접종률 제거
cond = df2['ratio'] <= 100
df2 = df2[cond]
top = df2['ratio'].head(10).mean()
bottom = df2['ratio'].tail(10).mean()
print(round(top - bottom,1))
답변 2
0
시간에 따라 접종률이 점점 올라가서
최고 값이 국가별 마지막(최종) 값이라고 판단해서 max()가 있습니다.
데이터를 열어보면 한 국가에 여러 데이터가 있어서 아래 풀이는 이전데이터도 포함되어있어요!
원핫인코딩과 레이블 인코딩에서 concat
0
3
1
제2유형 질문입니다.
0
19
2
C()
0
16
2
작업형 2에서 strafity 적용 유무
0
21
2
수강 기간 연장 가능 여부 문의드립니다.
0
17
1
ols
0
20
2
2유형 작성관련 질문(일반 심화)
0
21
2
2유형 작성관련 질문
0
18
2
2유형 object컬럼 개수 다르면
0
20
2
코딩팡질문이요ㅠㅠ
0
22
2
관찰값과 기대값의 개념이 헷갈립니다.
0
13
2
작업형2 ID 컬럼 삭제 질문
0
23
2
2유형 작성관련 질문
0
20
2
memoryerror 질문
0
18
2
작업형 유형2 이렇게 고정 템플릿으로 가져가도 될까요?
0
21
1
ID 삭제 필수 인가요?
0
19
3
7회 기출문제 작업형1번 df 변환 후 저장되는 방식 질문
0
16
2
3 유형 귀무가설, 대립가설
0
20
2
인코딩 관련 질문 있습니다
0
24
2
작업형3 이원분산분석 sm에서불러오기 / anova_lm 차이
0
27
2
2유형 원핫인코딩 오류
0
23
2
시험장에서 주석 단축키 안될 때 많나요?
0
29
2
라벨인코딩 방식
0
29
2
test 재학습 관련
0
16
2






