์บ๊ธ [py] T1-1. ๋ฌธ์ ์์ ๋ต์ด ๋ค๋ฅด๊ฒ ๋์ต๋๋ค
์คํ๊ฐ ์์๊ตฐ์ ใ
ใ
ํด๋น ๋ถ๋ถ ์์ ํ๋๋ฐ ์ฌ์ ํ ๋ต์ด ๋ค๋ฅด๊ฒ ๋์ต๋๋ค!ใ
ใ
# your code import pandas as pd df = pd.read_csv("train.csv") # df.info() # df.head() # df.isnull().sum() # IQR์ ํ์ฉํด Fare์ปฌ๋ผ์ ์ด์์น๋ฅผ ์ฐพ๊ณ , # outlier1 = 1q - 1.5 * iqr # outlier2 = 3q + 1.5 * iqr # iqr = 3q - 1q q1 = df["Fare"].quantile(.25) q3 = df["Fare"].quantile(.75) iqr = q3 - q1 outlier1 = df[df["Fare"] (q3 + 1.5 * iqr)] # q1 - 1.5 * iqr, q3 + 1.5 * iqr # # ์ด์์น ๋ฐ์ดํฐ์ ์ฌ์ฑ ์๋ฅผ ๊ตฌํ์์ค len(outlier1["Sex"] == "female") + len(outlier2["Sex"] == "female")