feature 중요도 질문입니다.

Question

안녕하세요~ feature 중요도 관련하여 질문 드립니다.    105_PRACTICE_TITANIC_IMPORTANCE 파일의 아래 부분에서,  for alg in tree_models:     try:         print(alg.__class__.__name__)         print(alg.feature_importances_)             except:         print(alg.__class__.__name__, 'X')   try 구문에서 먼저 alg.fit(x_train, y_train)을 학습시키지 않아도 되는지 궁금합니다.  (이게 없으면 어떤 데이터의 feature를 기준으로 alg.feature_importances_ 를 실행할까? 라고 생각해서요.)  답변 기다리겠습니다. 감사합니다~

Answer

안녕하세요.

해당 주피터노트북의 상단에,

다음 코드로, 학습을 우선 시킨 것이거든요.

models = [

knn_model,

logreg_model,

svc_model,

decision_model,

random_model,

extra_model,

gbm_model,

nb_model,

xgb_model,

lgbm_model

]

k_fold = KFold(n_splits=10, shuffle=True, random_state=0) # K-Fold 사용

results = dict()

for alg in models:

alg.fit(X_train, y_train)

score = cross_val_score(alg, X_train, y_train.values.ravel(), cv=k_fold, scoring='accuracy')

results[alg.__class__.__name__] = np.mean(score)*100

그렇게 학습된 모델중, 다음 네개의 모델을 가져와서, 학습하며 계산된 feature_importances_ 를 기준으로 진행하였습니다.

tree_models = [

random_model,

extra_model,

gbm_model,

xgb_model

]

이 부분 주피터 노트북의 상단 코드를 다시 한번 보시면서, 위 글을 읽어보시면, 바로 이해하실 수 있으실 것 같습니다.

감사합니다.

Youngmin Jin

feature 중요도 질문입니다.

이 글과 비슷한 Q&A

len과 sum의 차이

'행'과 '인덱스'는 같은 개념이라고 봐도 될까요?

IBKR Desktop Global Configuration 설정

독립표본검정강의