Kaggle T-23
0
import pandas as pd
df = pd.read_csv('../input/bigdatacertificationkr/basic1.csv')
df = df.sort_values('f1', ascending = False)
f1_10 = df.iloc[9, 3]
print(f1_10)
df['f1'] = df['f1'].fillna(f1_10)
print(df.shape)
median1 = df['f1'].median()
df = df.drop_duplicates(subset = ['age'])
print(df.shape)
median2 = df['f1'].median()
print(median1)
print(median2)
print(abs(median2 - median1))위와 같이 코드 작성시 결과가
88.0
(100, 8)
(71, 8)
77.5
75.0
2.5로 나옵니다. 원래 풀이에는 중복값제거 중앙값이 77로 나와있는데 저는 코드를 수정해봐도 어디에 문제가 있는지 잘 모르겠습니다! 혹시 제 코드 어디에 문제가 있는걸까요?
답변 1
0
캐글 자료는 무료 콘텐츠로 검증을 거치지 않아 미흡할 수도 있다는 점 우선 안내드려요~
차이는 정렬한 데이터프레임에서 중복제거와 정렬전 데이터프레임에서 중복제거 때문에 발생한 현상입니다.
제가 문제를 더 명확히 했어야했네요!! :)
뒤로가기 버튼 같은 것이 있나요?
0
18
1
강의 연장 문의
0
17
1
출력값 질문
0
26
2
수업노트가 어디에 있나요?
0
27
1
실기시험 제출관련
0
157
2
6.20 작업형 2 과적합
0
164
3
코딩팡 장업형2 베이스 라인 인코딩 종류 질문
0
51
2
로지스틱회귀, 회귀
0
50
2
회귀 문제를 풀때 질문입니다.
0
58
1
불균형 처리 후 성능이 더 낮아졌다면,
0
64
2
실기 체험 제2유형 에러 문의
0
64
1
LIGHTGBM 으로 하면 pred값이 소수점 6자리까지 나오는게 맞나요
0
51
2
3번문제 등분산 가정
0
49
2
작업형3 target 형 변환 질문
0
36
2
[작업형1] 연습문제 섹션1 ~ 10 의 section4
0
39
3
원핫인코딩과 레이블 인코딩에서 concat
0
60
2
제2유형 질문입니다.
0
48
2
C()
0
44
2
작업형 2에서 strafity 적용 유무
0
52
2
수강 기간 연장 가능 여부 문의드립니다.
0
61
1
ols
0
44
2
2유형 작성관련 질문(일반 심화)
0
40
2
2유형 작성관련 질문
0
41
2
2유형 object컬럼 개수 다르면
0
48
2





