해결된 질문
작성
·
200
·
수정됨
0
T1-21 문제 풀어보고 있는데요, 캐글에서 올려주신 코드로 작성한 결과와 제가 작성한 코드의 결과가 달라 질문 드립니다.
(*제가 작성한 전체 코드는 맨 아래에 있습니다.)
바로 아래 코드에 대한 출력값은 90, 30, 30, 30 입니다. (답은 167.0 으로 출력됩니다.) 이를 통해 이상값 처리와 데이터 분할 모두 옳게 했다고 볼 수 있는데, 답은 165가 아닌 167이 나와서 도대체 어디서 잘못된건지 모르겠습니다. 답변 주시면 감사하겠습니다!
# print(len(df['age']))
# print(len(df['age'].iloc[:30]))
# print(len(df['age'].iloc[30:60]))
# print(len(df['age'].iloc[60:90]))
import pandas as pd
import numpy as np
df = pd.read_csv('../input/bigdatacertificationkr/basic1.csv')
# print(df.head())
# print(df.info())
cond1 = df['age'] > 0
cond2 = df['age'] == round(df['age'], 0)
df = df[cond1 & cond2]
# print(df.head())
# print(len(df['age']))
# print(len(df['age'].iloc[:30]))
# print(len(df['age'].iloc[30:60]))
# print(len(df['age'].iloc[60:90]))
median1 = df['age'].iloc[:30].median()
median2 = df['age'].iloc[30:60].median()
median3 = df['age'].iloc[60:90].median()
print(median1+median2+median3)
어머 저 바보인가봐요.......ㅎㅎ 괜시리 죄송하네요 답변 주셔서 감사합니다~!!