inflearn logo
강의

Course

Instructor

[Side Project After Work] Big Data Analysis Certification Practical Exam (Type 1, 2, 3)

4th Session Past Exam Type (Task Type 1)

캐글 [py] T1-1. 문제에서 답이 다르게 나옵니다

Resolved

172

soyoung an

22 asked

0

 



import pandas as pd
df = pd.read_csv("train.csv")
# df.info()
# df.head()
# df.isnull().sum()

#  IQR을 활용해 Fare컬럼의 이상치를 찾고, 
# outlier1 = 1q - 1.5 * iqr
# outlier2 = 3q + 1.5 * iqr
# iqr = 3q - 1q

q1 = df["Fare"].quantile(.25)
q3 = df["Fare"].quantile(.25)
iqr = q3 - q1

# outlier1 = df["Fare"] < (q1 - 1.5 * iqr)
# outlier2 = df["Fare"] > (q3 + 1.5 * iqr)
q1 - 1.5 * iqr, q3 + 1.5 * iqr

outlier1 = df[df["Fare"] < (q1 - 1.5 * iqr)]
outlier2 = df[df["Fare"] > (q3 + 1.5 * iqr)]

# # 이상치 데이터의 여성 수를 구하시오
len(outlier1["Sex"] == "female") + len(outlier2["Sex"] == "female")

python 머신러닝 빅데이터 pandas 빅데이터분석기사

Answer 2

0

soyoung an

오타가 있었군요 ㅠㅠ

해당 부분 수정했는데 여전히 답이 다르게 나옵니다!ㅠㅠ

# your code

import pandas as pd
df = pd.read_csv("train.csv")
# df.info()
# df.head()
# df.isnull().sum()

#  IQR을 활용해 Fare컬럼의 이상치를 찾고,
# outlier1 = 1q - 1.5 * iqr
# outlier2 = 3q + 1.5 * iqr
# iqr = 3q - 1q

q1 = df["Fare"].quantile(.25)
q3 = df["Fare"].quantile(.75)
iqr = q3 - q1

outlier1 = df[df["Fare"] < (q1 - 1.5 * iqr)]
outlier2 = df[df["Fare"] > (q3 + 1.5 * iqr)]
# q1 - 1.5 * iqr, q3 + 1.5 * iqr

# # 이상치 데이터의 여성 수를 구하시오
len(outlier1["Sex"] == "female") + len(outlier2["Sex"] == "female")

0

roadmap

q1 = df["Fare"].quantile(.25)

q3 = df["Fare"].quantile(.25)
가 동일한 값으로 들어갔네요! 수정이 필요해요!

0

soyoung an

오타가 있었군요 ㅠㅠ

해당 부분 수정했는데 여전히 답이 다르게 나옵니다!ㅠㅠ

# your code

import pandas as pd
df = pd.read_csv("train.csv")
# df.info()
# df.head()
# df.isnull().sum()

#  IQR을 활용해 Fare컬럼의 이상치를 찾고,
# outlier1 = 1q - 1.5 * iqr
# outlier2 = 3q + 1.5 * iqr
# iqr = 3q - 1q

q1 = df["Fare"].quantile(.25)
q3 = df["Fare"].quantile(.75)
iqr = q3 - q1

outlier1 = df[df["Fare"] < (q1 - 1.5 * iqr)]
outlier2 = df[df["Fare"] > (q3 + 1.5 * iqr)]
# q1 - 1.5 * iqr, q3 + 1.5 * iqr

# # 이상치 데이터의 여성 수를 구하시오
len(outlier1["Sex"] == "female") + len(outlier2["Sex"] == "female")

 

0

roadmap

len(outlier1["Sex"] == "female") + len(outlier2["Sex"] == "female")
에서 len()대신 sum()을 사용해야 합니다.
len() : True도 1개, False도 1개로 모든 데이터 수를 카운트 합니다.

sum(): True는 1, False는 0으로 True의 수만 계산됩니다.

작업형 1 유형 부분

0

19

2

작업형 1 (삭제예정, 구 버전)

0

34

2

수강기간 연장 문의드립니다.

0

26

1

2유형 레이블 인코딩 VS 원핫 인코딩

0

27

3

수강기간 연장 문의드립니다.

0

28

1

인덱스 슬라이싱

0

29

2

질문 드립니다.

0

46

2

강의 내용 관련 질문드립니다~

0

43

2

수강 연장 문의

0

57

2

강의자료 일괄 다운로드

0

52

2

수강기간 연장 문의드립니다

0

41

2

list 문제 질문드립니다~

0

36

2

빅분기 실기 12회 재도전

0

55

2

강의 기간 연장 가능여부 검토 요청건

0

40

2

수강기간 연장 문의 드립니다

0

43

2

수강기간 연장 문의드립니다

0

50

2

질문이요

0

56

2

수강기간 연장 문의드립니다.

0

58

2

문제 3-2 질문드립니다

0

47

2

수강기간 연장 문의 드립니다.

0

61

2

변수, 칼럼 , df 구분

0

51

2

수강기간 연장 문의드립니다.

0

50

2

수강기간 연장 문의

0

49

2

수강기간 연장 문의드립니다.

0

42

2