inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[리뉴얼] 처음하는 파이썬 머신러닝 부트캠프 (쉽게! 실제 캐글 문제 풀며 정리하기) [데이터분석/과학 Part2]

feature 중요도 질문입니다.

322

Youngmin Jin

작성한 질문수 1

0

안녕하세요~ feature 중요도 관련하여 질문 드립니다.
 
 
105_PRACTICE_TITANIC_IMPORTANCE 파일의 아래 부분에서,
for alg in tree_models:
    try:
        print(alg.__class__.__name__)
        print(alg.feature_importances_)        
    except:
        print(alg.__class__.__name__, "X")
 
try 구문에서 먼저 alg.fit(x_train, y_train)을 학습시키지 않아도 되는지 궁금합니다.
(이게 없으면 어떤 데이터의 feature를 기준으로 alg.feature_importances_ 를 실행할까? 라고 생각해서요.)
 
답변 기다리겠습니다. 감사합니다~

kaggle python pandas 머신러닝 배워볼래요?

답변 1

1

잔재미코딩 DaveLee

안녕하세요. 

해당 주피터노트북의 상단에, 

다음 코드로, 학습을 우선 시킨 것이거든요.

 

models = [

    knn_model,

    logreg_model,

    svc_model,

    decision_model,

    random_model,

    extra_model,

    gbm_model,

    nb_model,

    xgb_model,

    lgbm_model

]

 

k_fold = KFold(n_splits=10, shuffle=True, random_state=0)           # K-Fold 사용

results = dict()

for alg in models:

    alg.fit(X_train, y_train)

    score = cross_val_score(alg, X_train, y_train.values.ravel(), cv=k_fold, scoring='accuracy')

    results[alg.__class__.__name__] = np.mean(score)*100

 

그렇게 학습된 모델중, 다음 네개의 모델을 가져와서, 학습하며 계산된 feature_importances_ 를 기준으로 진행하였습니다.

tree_models = [

    random_model,

    extra_model,

    gbm_model,

    xgb_model

]

 

이 부분 주피터 노트북의 상단 코드를 다시 한번 보시면서, 위 글을 읽어보시면, 바로 이해하실 수 있으실 것 같습니다.

 

감사합니다.

자료 공유 질문

0

70

1

Ascii 에러 관련하여 질문드립니다

0

97

1

고차원 데이터 질문

0

85

1

세션4 범주형 데이터 분석 패턴 강의 질문

0

217

2

pandas 2.2.2, xgboost 2.1.3 에러 해결 방법

0

235

1

sklearn v1.5.1

0

176

1

머신러닝 적용을 위한 Feature Engineering 작업1

0

185

2

missingno 대체

0

174

1

scikit-learn 1.5.1 matplotlib 3.9.2

0

136

1

환불문의

0

273

1

자료공유를 받으려고 하는데 에러가 납니다.

0

171

1

iplot에서 항상 에러나는 분 안계신가용?

0

234

1

사망 여부 영향 가능성

0

149

1

섹션4_인코딩 이해하고 적용해보기(원핫인코딩) 질문

0

195

1

df.corr(numeric_only=True).iplot() 에러 해결 어떻게 해야되나요?

0

288

1

주피터 노트북 201_REGRESSION_BIKE_SHARING_MODELS 중 질문

0

252

1

3강 강의 자료 코드 관련 질문입니다

1

344

1

맥 사용자 mkdir .kaggle 했는데 파일이 안만들어집니다.

0

428

1

Bayesian Optimization에서 optimizer.maximize()함수를 더이상 지원 안한다고 합니다.

0

887

2

Bayesian Optimization LightGBM 적용

0

469

2

하이퍼 파라미터 튜닝 기법 적용하기 실행값이 미묘하게 달라요.

1

347

1

중복된 코드 수정 요청 - 자전거 공유 문제 이해와 EDA3

0

218

1

강의 중 에러 질문

0

756

1

cross_val_score 에러

0

470

1