25mgsong
@mingisong
Reviews Written
-
Average Rating
-
Posts
Q&A
GridSearchCV
์ ์ ๊ฐ ์๋ชป ์๊ธฐํ๋ค์1) GridSearchCV๊ฐ์ฒด์ fit() ๋ฉ์๋์ ์ธ์๋ก x_train, y_train์ ์ค๋ GridSearchCV๊ฐ์ฒด๊ฐ ์์์ ์ต์ ํ์ดํผ ํ๋ผ๋ฏธํฐ๋ฅผ ์ถ๋ก ํด๋ธ๋ค๋ ๋ง์ GridSearchCV ๊ฐ์ฒด ๋ด๋ถ์์ fit ๋งค์๋์ ์ธ์๋ก ๋ค์ด์จ x_train๊ณผ y_train์ ๋ค์ ํธ๋ ์ธ์ ๊ณผ ํ ์คํธ์ ์ผ๋ก ์ชผ๊ฐ์ด์ ์ฑ๋ฅ ํ๊ฐ๋ฅผ ์งํํ๋์?2) ๋ง์ฝ 1๋ฒ ์ง๋ฌธ์ด ๋ต๋ณ์ด YES ๋ผ๋ฉด, titanic_df ์ ์ ์ฒด ๋ ์ด๋ธ๊ฐ๊ณผ ์ ์ฒด ํ๊ฒ๊ฐ์ ์ธ์๋ก ์ฃผ๋ฉด, GridSearchCV ๊ฐ์ฒด ๋ด๋ถ์์ fit ๋งค์๋๋ฅผ ์ด์ฉํ์ฌ ์ด ๋ ์ธ์๋ฅผ ํธ๋ ์ธ์ ๊ณผ ํ ์คํธ์ ์ผ๋ก ์ชผ๊ฐ์ด์ ์ฑ๋ฅ ํ๊ฐ๋ฅผ ์งํํ๋ค๋ ๋ง์ด ๋ฉ๋๋ค.๊ทธ๋ผ, ๊ตณ์ด x_train๊ณผ y_train์ ์ธ์๋ก ์ฃผ์ด์ผ ํ๋์ง์? ์ ํ๋ (scoring = "accuracy")๋ฅผ ๊ทน๋ํ ํ ๋ ค๋ฉด ์์ ๋ฐฉ์์ด ๋ ์ ํฉํ ๊ฒ ๊ฐ์ต๋๋ค๋ง...from sklearn.model_selection import train_test_split from sklearn.model_selection import GridSearchCV import random random_num = 0 fit_all = 0 fit_trains = 0 for i in range(1000): random_num = random.randint(1, 1000) X_train, X_test, y_train, y_test = train_test_split(label, target, test_size=0.2, random_state=random_num) parameters = {'max_depth':[2,3,5,10], 'min_samples_split':[2,3,5], 'min_samples_leaf':[1,5,8]} grid_dtc = GridSearchCV(dtc, param_grid=parameters, scoring="accuracy", cv=5) grid_dtc.fit(label, target) best_dtc = grid_dtc.best_estimator_ pred = best_dtc.predict(X_test) fit_all += accuracy_score(pred, y_test) grid_dtc = GridSearchCV(dtc, param_grid=parameters, scoring="accuracy", cv=5) grid_dtc.fit(X_train, y_train) best_dtc = grid_dtc.best_estimator_ pred = best_dtc.predict(X_test) fit_trains+= accuracy_score(pred, y_test) print("fit_all ํ๊ท ์ ํ๋:", np.round(fit_all/1000,4)) print("fit_trains ํ๊ท ์ ํ๋:", np.round(fit_trains/1000,4)) ------------------------------------ fit_all ํ๊ท ์ ํ๋: 0.8368 fit_trains ํ๊ท ์ ํ๋: 0.8066
- 0
- 2
- 246
Q&A
๋ํ์ด ํฌ์ ์ธ๋ฑ์ฑ ์ง๋ฌธ์ ๋๋ค
2์ฐจ์ ndarray์์์ ํฌ์ ์ธ๋ฑ์ฑ์ 2์ฐจ์ ์ขํ๊ณ์์์ ๋์์ ์ ์๋ ๊ฐ์ ๋ฐํ์์ผ์ฃผ๋ ๊ฒ์ด๊ตฐ์... ๊ฐ์ฌํฉ๋๋ค!
- 0
- 2
- 378




