jooho9911221407
@jooho9911221407
Reviews Written
1
Average Rating
5.0
Posts
Q&A
PCA ๊ด๋ จ ์ง๋ฌธ
import pandas as pd from sklearn.decomposition import PCA from sklearn.preprocessing import StandardScaler from sklearn.ensemble import RandomForestClassifier from sklearn.model_selection import cross_val_score df=pd.read_excel('/content/drive/MyDrive/credit_card.xls',sheet_name='Data',header=1) df.rename(columns={'PAY_0':'PAY_1','default payment next month':'default'},inplace=True) X_features=df.drop(['ID', 'default'],axis=1) y_target=df['default'] bill_cols=['BILL_AMT'+str(i) for i in range(1,7)] scaler=StandardScaler() df_cols_scaled=scaler.fit_transform(X_features[bill_cols]) pca=PCA(n_components=2) col_pca=pca.fit_transform(df_cols_scaled) bill=pd.DataFrame(data=col_pca, columns=['bill_pca_1','bill_pca_2']) df0=df.copy() pca_df=pd.concat([df0,bill],axis=1) pca_df.drop(bill_cols,axis=1,inplace=True) X_features1=pca_df.drop('default',axis=1) y_target=pca_df['default'] rf=RandomForestClassifier(n_estimators=300, random_state=156) scores=cross_val_score(rf, X_features1, y_target,scoring='accuracy', cv=3) print('ํ๊ท ์ ํ๋:', np.round(np.mean(scores),4)) ์ด๋ฐ ์์ผ๋ก ์ฝ๋๋ฅผ ์ง๋ดค๋๋ฐ 0.61์ ๋๋ก ์์ธก ์ฑ๋ฅ์ด ๋ง์ด ๋จ์ด์ง๋ ๊ฒ ๊ฐ์ต๋๋ค
- 0
- 3
- 213
Q&A
์ด์์น ์ ๊ฑฐ ๊ด๋ จ ์ง๋ฌธ
TARGET์ด 0์ธ ๋ฐ์ดํฐ ์ค์์ ๊ฐ ์ด์ 1.5*IQR ๋ฐ๊นฅ์ ์๋ ์ธ๋ฑ์ค์ TARGET์ด 1์ธ ๋ฐ์ดํฐ ์ค์์ ๊ฐ ์ด์ 1.5*IQR ๋ฐ๊นฅ์ ์๋ ์ธ๋ฑ์ค๋ฅผ ๋ชจ์์ ์ค๋ณต๋๋ ๋ถ๋ถ์ ํฉ์งํฉ ํํ๋ก ์ ๊ฑฐํ๋๋ ๊ทธ๋ ๊ฒ ๋ง์ ๋ฐ์ดํฐ๊ฐ ์ฌ๋ผ์ง ๊ฒ ๊ฐ์ต๋๋ค..! ๋ชจ๋ ์ด์ด ์ค์ํ ๊ฑด ์๋๊ธฐ์ ์ด๋ฐ ๋ฐฉ์์ ์ง์ํด์ผ ํ ๊น์? ์ด์์น ์ ๊ฑฐ๋ณด๋จ ์ต๋น๊ฐ์ผ๋ก ๋์ฒดํด์ฃผ๋ ๋ฐฉ๋ฒ์ด ๋ ๋์์ง, 1.5๋ณด๋ค ํฐ ์*IQR๋ก ์ด์์น๋ฅผ ์ ๊ฑฐํด๋ด์ผ ํ ์ง ๋ชจ๋ฅด๊ฒ ์ต๋๋ค.. ์๊ฐํด๋ณด๋ 18000 ๋ฐ์ดํฐ ์ค, train_test_split์ผ๋ก ์ฝ 15000๊ฐ๋ฅผ ํ์ต์ผ๋ก ์ฐ๊ณ 3000๊ฐ ์ ๋๋ฅผ ํ ์คํธ ๋ฐ์ดํฐ๋ก ์ฐ๋ค๋ณด๋ ์๋ ์ ์ ๋ฐ์ดํฐ๋ผ ํ๊ฐ์งํ๊ฐ ๋๊ฒ ๋์จ ๋ฏ ํฉ๋๋ค!
- 0
- 3
- 781
Q&A
์๊ณ๊ฐ ๋ณํ์ ๋ฐ๋ฅธ ์ ๋ฐ๋์ ๋ณํ
์ ์ ๊ฐ ์๋ชป ์ ์ ๊ฒ ๊ฐ์ต๋๋ค. ์ ๊ฐ ์๋ํ ์ง๋ฌธ์ ์๋์ ๊ฐ์ต๋๋ค! ์ฑ ์์๋ ๋ถ๋ฅ ์๊ณ๊ฐ์ด ๊ฐ์ํจ์ ๋ฐ๋ผ ์ฌํ์จ์ ์ฆ๊ฐํ๊ณ ์ ๋ฐ๋๋ ๊ฐ์ํ๋ค๊ณ ๋์์์ต๋๋ค. ์๊ณ๊ฐ์ด ๊ฐ์ํ๋ค๋ ๊ฒ์ ๊ทธ๋งํผ FP, TP๊ฐ ์ฆ๊ฐํ๋ค๋ ๊ฒ์ ์๋ฏธํ๋๋ฐ ์๊ณ๊ฐ์ด ๊ฐ์ํจ์ ๋ฐ๋ผ FN์ด ์ค์ด๋ค๊ณ TP๊ฐ ์ฆ๊ฐํ๋ ์ฌํ์จ๊ณผ๋ ๋ค๋ฅด๊ฒ ์ ๋ฐ๋๋ ํ์คํ ๊ฐ์ํ๋ค๊ณ ๋ณผ ์ ์์ง ์๋์? ์๋ฅผ ๋ค์ด, ์๊ณ๊ฐ ๋ณ๋ ์ ์ ์ ๋ฐ๋๊ฐ 80/100(=0.8)์ด๊ณ , ์์ฑ์์ธก์ด ์ฆ๊ฐํ์ฌ ๋ง๋ ์์ธก์ด 10๊ฑด, ํ๋ฆฐ ์์ธก์ด 1๊ฑด์ผ ๊ฒฝ์ฐ, ์ ๋ฐ๋๊ฐ 90/111(= ์ฝ 0.82)๊ฐ ๋์ด ๋ถ๋ฅ์๊ณ๊ฐ์ด ์ฆ๊ฐํ๋๋ผ๋ ์ ๋ฐ๋๋ ๋์์ง ์ ์์ง ์๋์? ์๊ณ๊ฐ์ด ๊ฐ์ํ๋ฉด ์ ๋ฐ๋๊ฐ ๊ฐ์ํ๋ ๊ฒ์ด ๋์ฒด์ ์ผ๋ก ๋ ๋น๋ฒํ๋ค๊ณ ์์๋๋ฉด ๋ ๊น์?
- 0
- 3
- 349
Q&A
๊ต์ฐจ ๊ฒ์ฆ
๊ฐ์ฌ๋, ํน์ ๋ฐ์ดํฐ๋ฅผ ํ์ต, ๊ฒ์ฆ, ํ ์คํธ ๋ฐ์ดํฐ๋ก ๋๋๋ ์ฆ, ๋ณ๋์ ํ ์คํธ ๋ฐ์ดํฐ๋ฅผ ๋ถ๋ฆฌํ๋ ๊ณผ์ ์ cross_val_score()์ ํฌํจ๋์ด ์๋๊ฑด๊ฐ์? ์๋๋ผ๋ฉด ๋ณ๋์ ํ ์คํธ ๋ฐ์ดํฐ์ ์ ๋ถ๋ฆฌ๋ ์ฝ๋๋ก ๋ํ๋์ ๋, ์ด๋ค์์ธ์ง ์๋ ค์ฃผ์๋ฉด ๊ฐ์ฌํ๊ฒ ์ต๋๋ค! ํ์ต/ํ ์คํธ ๋ฐ์ดํฐ์ ์ผ๋ก ๋๋๊ณ ํ์ต ๋ฐ์ดํฐ๋ง ๊ต์ฐจ๊ฒ์ฆ์ ํด๋ณด๋ ์ฝ๋๋ฅผ ์ง๋ณด๋ ค๊ณ ํ๋๋ฐ ์๊ฐ๋ณด๋ค ์์๋๋ค์ใ ใ
- 0
- 3
- 420
Q&A
best_score_๊ฐ๊ณผ pred๊ฐ์ด ๋ค๋ฅธ ์ด์
์ํ ์ ๋ง ๊ฐ์ฌํฉ๋๋ค! ์ดํด๋์ต๋๋คใ ใ
- 2
- 6
- 778
Q&A
best_score_๊ฐ๊ณผ pred๊ฐ์ด ๋ค๋ฅธ ์ด์
๊ฐ์ฌ๋, iris๋ฐ์ดํฐ์ ์ ํ๊ท ๊ฐํ๊ณ ๋ถ์ฐ๊ฐ์ ๊ตฌํด๋ณด์๋๋ฐ ์ฑ ์ด๋ ๋ฏธ์ธํ๊ฒ ๋ค๋ฅธ๊ฑธ ๋ณด๋ ๊ตฌ๊ธ์ฝ๋ฉ์ iris ๋ฐ์ดํฐ์ ์ด ์ฝ๊ฐ ๋ค๋ฅธ๊ฒ ๊ฐ์ต๋๋ค..! ์ด ๋ถ๋ถ์ด best_score_๊ฐ๊ณผ pred๊ฐ์ด ๋ค๋ฅธ ์ด์ ์ ์ํฅ์ ๋ฏธ์น ์๋ ์๋๊ฑด๊ฐ์?
- 2
- 6
- 778
Q&A
best_score_๊ฐ๊ณผ pred๊ฐ์ด ๋ค๋ฅธ ์ด์
(์ฌ์ง)์ด์ฒ๋ผ ์ ํ๋๊ฐ ๋ค๋ฅด๊ฒ ๋์ค๋๋ฐ ์ด์ ๋ฅผ ์๋ชป์ฐพ๊ฒ ์ต๋๋ค.
- 2
- 6
- 778
Q&A
best_score_๊ฐ๊ณผ pred๊ฐ์ด ๋ค๋ฅธ ์ด์
X_test๋ฅผ validation์ผ๋ก ์ฌ์ฉํ๋๊ฑด ์ด๋ป๊ฒ ํ๋์ง ์ ํํ ์๋ชจ๋ฅด๊ฒ ์ด์ ์ค๋ช ํด์ฃผ์๋ฉด ๊ฐ์ฌํ๊ฒ ์ต๋๋ค!ใ ใ ์์ค์ฝ๋ ๋ฐ๋ผํ ์ฌ์ง ์ฒจ๋ถํ๊ฒ ์ต๋๋ค!(์ฌ์ง)
- 2
- 6
- 778




