Jason
@sxxzy2521
Reviews Written
-
Average Rating
-
Posts
Q&A
์ฌํ๊ฒ์ ์ง๋ฌธ๋๋ฆฝ๋๋ค.
์ํ ๋ฌธ์ ์์ ์ฌํ๊ฒ์ ์ ํฌํค๋ก ๊ฒ์ ํ๋ผ๊ณ ํ ์๋ ์๊ณ ,๋ณธํ๋ก๋๋ก ๊ฒ์ ํ๋ผ๊ณ ํ ์์์ผ๋ ๊ฐ์ํด์ฃผ์ ๊ฑฐ ์๋๊น ์ถ์๋ฐ.. ๊ฐ์ ์ฌํ๊ฒ์ ์ข ๋ฅ๊ฐ ๋ง๋ค๊ณ ํ์ จ๊ธด ํ๋๋ฐ, ๊ฐ์ฅ ๋ง์ด ์ฌ์ฉํ๋ ์ฌํ๊ฒ์ ๋ฐฉ์์ด 2๊ฐ๋ผ๊ณค ํ์ จ์ต๋๋ค.์ฌ์ค ์ ๋ ๊ถ๊ธํ๊ธด ํ๋ค์.
- 0
- 2
- 354
Q&A
์์ฝ์จ ๋ถํธ์์ ๊ฒ์ ์ง๋ฌธ์ ๋๋ค
๊ฐ์ ์ธ ์ปค๋ฎค๋ํฐ ๊ธ๋ ๋ณด๋ฉด์ ๊ณต๋ถ/์ ๋ฆฌํ๊ณ ์๋ ์๊ฐ์์ ๋๋ค.์์ฑ์๋ถ๊ป์ ๋ง์ํ์ ๊ฐ๋ ์ด ๋ง์ต๋๋ค. ์ ๊ฐ ์๊ณ ์๋ ๊ฐ๋ ์ ๋ง์๋๋ฆฌ๋ฉด์์ธก ๊ฒ์ ์ ๊ฒฝ์ฐ '~์ด๋ค/~์๋๋ค' ๋ผ๊ณ ๊ท๋ฌด/๋๋ฆฝ๊ฐ์ค์ด ์ค์ ๋์์ ๋ ์งํํ๋๋ฐ๊ฒ์ ์ ๊ธฐ๋ณธ๊ฐ์ด alternative='two-sided' ์ด๊ธฐ ๋๋ฌธ์ alternative ํ๋ผ๋ฏธํฐ๋ฅผ ๋ณ๋ ์ฃผ์ง ์์๋ ๋ฉ๋๋ค. ๋จ์ธก ๊ฒ์ ์ ๊ฒฝ์ฐ์๋ '~์ด๋ค/~์๋ค' or '~์ด๋ค/~'ํฌ๋ค' ๋ผ๋ ๊ฐ๋ ์ด ๋ค์ด๊ฐ์๋๋ฆฝ๊ฐ์ค์ด ์ฑํ๋ ์กฐ๊ฑด์ด ์ฑ๋ฆฝ๋๊ฒ alternative ํ๋ผ๋ฏธํฐ๋ฅผ ์ค์ ํด์ค์ผ ํฉ๋๋ค. ์ ์์ ๋๋ฆฝ๊ฐ์ค์ 'ํ๊ท ๋ฌด๊ฒ๊ฐ 120g ๋ณด๋ค ์๋ค' ์ด๊ธฐ ๋๋ฌธ์ df['๋ฌด๊ฒ']-120์ด ์์๊ฐ์ด ๋์์ผ ๋๋ฆฝ๊ฐ์ค์ด ์ฑํ๋๋ ์ํฉ์ด๊ณ ์์๊ฐ์ด ๋์ค๊ธฐ ์ํด์๋ ' df['๋ฌด๊ฒ'] ์์์ผ ํจ โalternative๋ฅผ less ์ค์ '์ ํ๋ฆ์ผ๋ก ๋ฌธ์ ํ๊ณ ์์ต๋๋ค ^^
- 0
- 2
- 518
Q&A
์์๋ฌธ์ ์์ ํ2(๊ตฌ ๋ฒ์ )
pd.DataFrame ๋ง๋์ค ๋,test_id๋ฅผ y_train์ ์๋ cust_id ๊ฐ์ผ๋ก ๋ง๋์ ๊ฑฐ ๊ฐ์๋ฐ์y_train shape์ด ์๋ง 3500 ์ด์์๊ฑฐ ๊ฐ๊ณ , ๊ฒฐ๊ณผ๊ฐ์ผ๋ก ์ ์ฅํ์๋ ค๋ gender์ ์์ธก๊ฐ์ 2482๊ฐ๋ผ์ ์๋ฌ๋ฐ์ํ๊ฑฐ ๊ฐ์ต๋๋ค. ๋ถ๋ฆฌ๊ณผ์ ์์ y_train['gender']์ ๋ํ ์๋ฆฌ์ฆ ๊ฐ์ ๋ช ์ํ์ จ์ผ๋,drop ๊ณผ์ ์์ y_train์ column drop์ด๋ผ๋์ง pop ์์ดtest_id = X_test.pop('cust_id')๋ก pop ํ์๋ฉด ๋ ๊ฑฐ๊ฐ์ต๋๋ค.
- 0
- 2
- 551
Q&A
3์ ํ ์ ํฉ๋๊ฒ์ ๋ฌธ์
์๋ ํ์ธ์,์ผํ๋ด์๋ ๊ธฐ๋์น์ ํ๋ฅ ๊ฐ * ์ ์ฒดํ์์์ผ๋ก ๋์ด์์ง ์์ ๊ฑฐ ๊ฐ์๋ฐ์%๋๊น 0.2 * 200, 0.3 * 200.. ์ด๋ ๊ฒ ํด์ผ๋์ง ์์๊น์ถ๋ค์์ ๋ ๊ถ๊ธํ๋ค์ ์ ์ค๋ฅ๋๋์ง
- 0
- 2
- 323
Q&A
์์ ํ 2์ ํ label encoding
๊ฐ์ธ์ ์ธ ๊ณต๋ถ ์ฐจ์์์ ์ปค๋ฎค๋ํฐ ๊ธ ๋ณด๋ฉด์ ํ์ต ์ค์ธ ์๊ฐ์์ ๋๋ค. train๊ณผ test ๋ชจ๋ fitting ์ํค๋ ๊ฑด ์ ๋ชจ๋ฅด๊ฒ ๋๋ฐfit_transform๊ณผ transform ๊ณผ์ ์ ๋ํด ์ ์๋์ด ์๋ ค์ฃผ์ ๋ด์ญ์ ์ ๋ฌ ๋๋ฆฌ๋ฉด Train ๋ฐ์ดํฐ์๋ fit_transform ํจ์(fit์ transform์ 2๊ฐ ํฉ์ณ ๋์)Test ๋ฐ์ดํฐ์๋ transform ํจ์๋ฅผ ์ฌ์ฉํ๋๋ฐ, fit๋ Train ๋ฐ์ดํฐ์ ์๋ ์ซ์๊ฐ ์๋ ๋ฒ์ฃผํ ๋ณ์(ex. ์๋์ฐจ, ๊ธฐ์ฐจ ๋ฑ)๋ฅผ ํ์ตํ๊ณ ์๋์ฐจ๋ 0, ๊ธฐ์ฐจ๋ 1์ด๋ผ๋ ๋ผ๋ฒจ์ ๋ง๋๋ ๊ณผ์ ์ด๊ณ , transform์ '์๋์ฐจ' ๋ผ๋ ๋ฌธ์๋ฅผ ์ซ์ '0'์ ์ ์ฉํ๋ ๋จ๊ณ๋ผ๊ณ ๋ณด์๋ฉด ๋ ๊ฑฐ ๊ฐ์ต๋๋ค. train ๋ฐ์ดํฐ์์๋ ๋ฒ์ฃผํ ๋ณ์์ ๋ํ ๋ผ๋ฒจ(์๋์ฐจ: 0 , ๊ธฐ์ฐจ: 1)์ ์ด๋ฏธ ๋ง๋ค์์ผ๋ (fit ๊ณผ์ ),test ๋ฐ์ดํฐ์์๋ train์์ ๋ง๋ ๋ผ๋ฒจ์ ์ซ์๋ก ๋ณํํ๋ ๊ณผ์ ๋ง ํ์ํ๋ฏ๋ก, transform๋ง ์ ์ฉํ๋ค๊ณ ๋ณด์๋ฉด ๋ฉ๋๋ค.
- 0
- 2
- 561
Q&A
๊ฒฐ์ธก์น๊ฐ ์๋ ํ์ ์ ๊ฑฐํ ๋
1๋ฒ์ ๋ฐ์ดํฐํ๋ ์ ์ค 'ํ๋งค์' ์ปฌ๋ผ(df['ํ๋งค์'], Series)์ ๋ํด์๋ง ๊ฒฐ์ธก์น ์ฒ๋ฆฌ (๊ฒฐ์ธก์น๋ฅผ ํฌํจํ๊ณ ์์ผ๋ฉด ํ ์ญ์ ) ํ ์๋ฆฌ์ฆ ํํ๋ก ์ถ๋ ฅ๋๋๋ก ํ๋ ์ฝ๋์ธ๊ฑฐ ๊ฐ๊ณ ,๊ฒฐ๊ณผ๊ฐ์ด ํ๋งค์ ์ปฌ๋ผ๋ง ๋ณด์ 2๋ฒ์ ์ ์ฒด ๋ฐ์ดํฐํ๋ ์(df, DataFrame)์ ๋ํด์ 'ํ๋งค์' ์ปฌ๋ผ์ ๊ฒฐ์ธก์น๊ฐ ์๋ ํ์ ์ญ์ ์ฒ๋ฆฌ(subset = 'ํ๋งค์') ํ ๋ฐ์ดํฐํ๋ ์ ํํ๋ก ์ถ๋ ฅ๋๋๋ก ํ๋ ์ฝ๋์ธ๊ฑฐ ๊ฐ์ต๋๋ค. ๊ฒฐ๊ณผ๊ฐ์ด ์ ์ฒด ๋ฐ์ดํฐํ๋ ์์ผ๋ก ๋ณด์
- 0
- 2
- 292
Q&A
4ํ ๊ธฐ์ถ์ ํ ๋ง์ง๋ง ๋ฌธ์
๋ต์ด 11๊ฐ์ธ์ง๋ ์ ๋ชจ๋ฅด๊ฒ ์ผ๋,str ์ ๊ทผ์๋ฅผ ์ฌ์ฉํด์ contain ํจ์ ํ์ฉํ๋ฉด ๋ ๊ฑฐ ๊ฐ์ต๋๋ค. (๋จ Kingdom ์ด๋ผ๋ ๋ฌธ์์ด์ด ์๊ตญ์ ์๋ณํ ์ ์๋ ๊ฐ์ด๋ผ๊ณ ์๊ฐํ์ต๋๋ค. kingdom(์๋ฌธ์), UK(์ฝ์ด) ๋ฑ์ ๊ณ ๋ ค์ํจ) cond1 = df['date_added'].dt.year == 2018cond2 = df['date_added'].dt.month == 1 cond3 = df['country'].str.contains('Kingdom') df = df[cond1 & cond2 & cond3] print(len(df))
- 0
- 2
- 332
Q&A
5ํ ์2
์ง๋๊ฐ๋ค๊ฐ ๋์์ด ๋ ์ง ๋ชฐ๋ผ์ ๋ต๋ณ ๋๋ฆฝ๋๋ค. ์ฝ๋์์ rmse์ ๊ฐ์ mse ๊ฐ์ ๋ฃจํธ ์ฒ๋ฆฌํ๋๋ก ์ ์๋์ด ์๊ธฐ ๋๋ฌธ์rmse๋ง ์ ๋ ฅํด์ผ์ง ์ ์์ถ๋ ฅ๋ ๊ฑฐ๊ฐ์ต๋๋ค. rmse(y_val, pred)๋ก ์ ๋ ฅ์ ์ ์ ์ถ๋ ฅ๋๋ ค๋ฉด ์ฌ์ ์ ํจ์ ํํ๋ก ์ ์๊ฐ ํ์ํ ๊ฑฐ ๊ฐ์๋ฐ์ from sklearn.metrics import mean_squared_errordef rmse(x, y): return mean_squared_error(x, y) ** 0.5rmse(y_val, pred) ๋ก ํจ์ ์ ์ํ rmse(y_val, pred) ์ ๋ ฅํ์๋ฉด ์ ์ ์ถ๋ ฅ๋ ๊ฑฐ ๊ฐ์ต๋๋ค.
- 0
- 2
- 248
Q&A
์์ ํ 2 ์ฒดํ ํ๊ฒฝ์์ ์ ๊ณ์ ์๋์ ๊ฐ์.. ์ค๋ฅ๊ฐ ๋ฐ๊น์ ?
์๋ ํ์ธ์, ์ ๋ ๋์ผ์๋ฌ ๋ฐ์ํด์ ํด๊ฒฐํํฐ๋ผ ๋ถ์กฑํ์ง๋ง ๋ต๋ณ๋๋ฆฌ๊ฒ ์ต๋๋ค. ์๋ง๋ ๋๋คํฌ๋ ์คํธ model.fit ํจ์ ๋์์ y_train ์ค์ ๋ฐ์ดํฐ๋ฅผ train['์ฑ๋ณ']๋ก ํด์ ๋ฐ์ํ ์๋ฌ๋ก ๋ณด์ ๋๋ค. train['์ฑ๋ณ']์ด ์๋ ์์ฑ์๊ป์ pop์ผ๋ก ์ ์ฅํ์ target ๋ณ์๋ก ์ ๋ ฅํ ๊ฒฝ์ฐ ์ ์ ๋์ํ ๊ฒ์ผ๋ก ๋ณด์ ๋๋ค.์๋ ์ฐธ๊ณ ์ฐจ ์ฝ๋ ์ฌ๋ ค ๋๋ฆฝ๋๋ค.===============target = train.pop('์ฑ๋ณ')cols = train.select_dtypes(exclude='O').columns.to_list()from sklearn.ensemble import RandomForestClassifiermodel = RandomForestClassifier()model.fit(train[cols], target)model.predict_proba(test[cols])
- 0
- 3
- 416
Q&A
2ํ ๊ธฐ์ถ์ ํ(์์ ํ2)
๊ฒฝ๊ณ ์ ๊ฒฝ์ฐy_train = y_train.drop(columns = ['ID']) ๊ฐ ์๋y_train = y_train['ํ๊ฒ์ปฌ๋ผ']์ผ๋ก ํ๋ฉด ์์ด์ง๊ณ , ์ค๋ฅ์ ๊ฒฝ์ฐ์ฒ์ X_test ์ ์ฒ๋ฆฌํ์ค ๋ pop ํจ์๋ฅผ ํตํด ๋ค๋ฅธ๋ณ์๊ฐ ์๋ X_test๋ก ์ ์ฅํด๋ฒ๋ ค์X_test ๋ฐ์ดํฐ๋ ID๊ฐ๋ง ๋จ๋ ํํ๋ก ๋ณด์ ๋๋ค. (ํ์ columns๋ฅผ drop ์ํจ๊ฒ์ ์ด๋ฏธ X_test์๋ ๋ฐ์ดํฐ๊ฐ ์๊ธฐ๋๋ฌธ์ ์๋ฏธ ์์) ๋ฐ๋ผ์ X_test_id = X_test.pop('ID')๋ก ํ์๊ฑฐ๋X_test.pop('ID')๋ฅผ X_test.drop ๋คํ๊ณ ๋ฐ์ ํ๋๊น X_test.shape์ด X_train.shape๊ณผ ๋์ผํ ์ปฌ๋ผ ์๋ฅผ ๊ฐ๊ฒ ๋๊ณ ๋ชจ๋ธ ํ์ต์ด ๋๋ค์
- 0
- 2
- 243




