inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

Kaggle T-23

해결된 질문

239

김태범

작성한 질문수 15

0

import pandas as pd
df = pd.read_csv('../input/bigdatacertificationkr/basic1.csv')
df = df.sort_values('f1', ascending = False)
f1_10 = df.iloc[9, 3]
print(f1_10)

df['f1'] = df['f1'].fillna(f1_10)
print(df.shape)

median1 = df['f1'].median()
df = df.drop_duplicates(subset = ['age'])
print(df.shape)

median2 = df['f1'].median()

print(median1)
print(median2)
print(abs(median2 - median1))

위와 같이 코드 작성시 결과가

88.0
(100, 8)
(71, 8)
77.5
75.0
2.5

로 나옵니다. 원래 풀이에는 중복값제거 중앙값이 77로 나와있는데 저는 코드를 수정해봐도 어디에 문제가 있는지 잘 모르겠습니다! 혹시 제 코드 어디에 문제가 있는걸까요?

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 1

0

퇴근후딴짓

캐글 자료는 무료 콘텐츠로 검증을 거치지 않아 미흡할 수도 있다는 점 우선 안내드려요~

차이는 정렬한 데이터프레임에서 중복제거와 정렬전 데이터프레임에서 중복제거 때문에 발생한 현상입니다.

제가 문제를 더 명확히 했어야했네요!! :)

뒤로가기 버튼 같은 것이 있나요?

0

18

1

강의 연장 문의

0

17

1

출력값 질문

0

26

2

수업노트가 어디에 있나요?

0

27

1

실기시험 제출관련

0

157

2

6.20 작업형 2 과적합

0

164

3

코딩팡 장업형2 베이스 라인 인코딩 종류 질문

0

51

2

로지스틱회귀, 회귀

0

50

2

회귀 문제를 풀때 질문입니다.

0

58

1

불균형 처리 후 성능이 더 낮아졌다면,

0

64

2

실기 체험 제2유형 에러 문의

0

64

1

LIGHTGBM 으로 하면 pred값이 소수점 6자리까지 나오는게 맞나요

0

51

2

3번문제 등분산 가정

0

49

2

작업형3 target 형 변환 질문

0

36

2

[작업형1] 연습문제 섹션1 ~ 10 의 section4

0

39

3

원핫인코딩과 레이블 인코딩에서 concat

0

60

2

제2유형 질문입니다.

0

48

2

C()

0

44

2

작업형 2에서 strafity 적용 유무

0

52

2

수강 기간 연장 가능 여부 문의드립니다.

0

61

1

ols

0

44

2

2유형 작성관련 질문(일반 심화)

0

40

2

2유형 작성관련 질문

0

41

2

2유형 object컬럼 개수 다르면

0

48

2