[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

Kaggle T-23

해결된 질문2023-06-15T06:11:47.581Z

239

김태범

작성한 질문수 15

import pandas as pd
df = pd.read_csv('../input/bigdatacertificationkr/basic1.csv')
df = df.sort_values('f1', ascending = False)
f1_10 = df.iloc[9, 3]
print(f1_10)

df['f1'] = df['f1'].fillna(f1_10)
print(df.shape)

median1 = df['f1'].median()
df = df.drop_duplicates(subset = ['age'])
print(df.shape)

median2 = df['f1'].median()

print(median1)
print(median2)
print(abs(median2 - median1))

위와 같이 코드 작성시 결과가

88.0
(100, 8)
(71, 8)
77.5
75.0
2.5

로 나옵니다. 원래 풀이에는 중복값제거 중앙값이 77로 나와있는데 저는 코드를 수정해봐도 어디에 문제가 있는지 잘 모르겠습니다! 혹시 제 코드 어디에 문제가 있는걸까요?

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 1

퇴근후딴짓

2023-06-15T08:13:36.707Z

캐글 자료는 무료 콘텐츠로 검증을 거치지 않아 미흡할 수도 있다는 점 우선 안내드려요~

차이는 정렬한 데이터프레임에서 중복제거와 정렬전 데이터프레임에서 중복제거 때문에 발생한 현상입니다.

제가 문제를 더 명확히 했어야했네요!! :)

뒤로가기 버튼 같은 것이 있나요?

2026-06-26T15:20:38.296Z

강의 연장 문의

2026-06-26T03:20:38.020Z

출력값 질문

2026-06-24T12:26:55.287Z

수업노트가 어디에 있나요?

2026-06-23T07:11:33.421Z

실기시험 제출관련

2026-06-20T06:28:58.644Z

157

6.20 작업형 2 과적합

2026-06-20T04:23:55.395Z

164

코딩팡 장업형2 베이스 라인 인코딩 종류 질문

2026-06-19T21:10:17.635Z

로지스틱회귀, 회귀

2026-06-19T11:01:31.262Z

회귀 문제를 풀때 질문입니다.

2026-06-19T06:56:29.961Z

불균형 처리 후 성능이 더 낮아졌다면,

2026-06-19T06:12:48.627Z

실기 체험 제2유형 에러 문의

2026-06-19T05:08:00.718Z

LIGHTGBM 으로 하면 pred값이 소수점 6자리까지 나오는게 맞나요

2026-06-19T05:05:41.876Z

3번문제 등분산 가정

2026-06-19T01:35:38.160Z

작업형3 target 형 변환 질문

2026-06-19T01:33:51.482Z

[작업형1] 연습문제 섹션1 ~ 10 의 section4

2026-06-19T01:21:52.627Z

원핫인코딩과 레이블 인코딩에서 concat

2026-06-18T15:28:30.350Z

제2유형 질문입니다.

2026-06-18T10:36:02.567Z

C()

2026-06-18T09:54:32.325Z

작업형 2에서 strafity 적용 유무

2026-06-18T09:36:12.726Z

수강 기간 연장 가능 여부 문의드립니다.

2026-06-18T08:51:55.170Z

ols

2026-06-18T08:45:28.564Z

2유형 작성관련 질문(일반 심화)

2026-06-18T06:52:24.383Z

2유형 작성관련 질문

2026-06-18T06:22:01.218Z

2유형 object컬럼 개수 다르면

2026-06-18T05:49:00.431Z