inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

캐글 T1-12 질문!

해결된 질문

350

빅분초보

작성한 질문수 10

0

캐글 T1-12 문제에서 100%가 넘는 접종률은 제거 한다고 되어 있는데
위에 df2 = df[1:] 이게 이상치를 제거 하는게 맞는건가요?

처음 실행 했을 때 100이 넘는 값이 나왔고, 실행 할 수록 프린트 되어 나오는 값이 달라집니다.

그리고 저게 이상치를 제거한다는게 맞다면 저 코드(?)의 의미는 무엇인지 궁금합니다 [1:] 이부분이...

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 1

0

퇴근후딴짓

해당 문제는 출제 당시 코로나 데이터를 기준으로 했어요!
코로나 데이터가 계속 업데이트 되면서 100% 넘는 기준이 1개에서 3개로 늘었네요!
첫 줄뿐아니라 상위 3개가 제거 되어야 겠네요. 바로 수정할게요!! 감사합니다.
image

0

퇴근후딴짓


import pandas as pd

df = pd.read_csv("../input/covid-vaccination-vs-death/covid-vaccination-vs-death_ratio.csv")
# print(df.head())

df2 = df.groupby('country').max() #시간에 따라 접종률이 점점 올라감
df2 = df2.sort_values(by='ratio', ascending = False)

#100%가 넘는 접종률 제거
cond = df2['ratio'] <= 100
df2 = df2[cond]

top = df2['ratio'].head(10).mean()
bottom = df2['ratio'].tail(10).mean()

print(round(top - bottom,1))
# 결과값은 데이터 업데이트에 따라 달라질 수 있음

작업형 2 기출7회분에서

0

3

1

작업형2 모의문제1 (30강)

0

21

2

수강 기간 연장 문의 드립니다.

0

26

2

수강 계획과 관련해 문의 드립니다.

0

24

2

작업형1 - 연습문제 16~39 풀이는 몇강을 보면 되나요?

0

47

2

작업형 1 -연습문제 4-6

0

34

2

작업형 1 유형 부분

0

41

2

작업형 1 (삭제예정, 구 버전)

0

51

2

수강기간 연장 문의드립니다.

0

37

2

2유형 레이블 인코딩 VS 원핫 인코딩

0

36

3

수강기간 연장 문의드립니다.

0

42

2

인덱스 슬라이싱

0

36

2

질문 드립니다.

0

50

2

강의 내용 관련 질문드립니다~

0

46

2

수강 연장 문의

0

63

2

강의자료 일괄 다운로드

0

58

2

수강기간 연장 문의드립니다

0

48

2

list 문제 질문드립니다~

0

38

2

빅분기 실기 12회 재도전

0

63

2

강의 기간 연장 가능여부 검토 요청건

0

50

2

수강기간 연장 문의 드립니다

0

46

2

수강기간 연장 문의드립니다

0

52

2

질문이요

0

57

2

수강기간 연장 문의드립니다.

0

60

2