처음하는 파이썬 머신러닝 부트캠프 (쉽게! 실제 캐글 문제 풀며 정리하기) [데이터분석/과학 Part3]

하이퍼 파라미터 튜닝 기법 적용하기1 (XGBoost 실습)

Bayesian Optimization에서 optimizer.maximize()함수를 더이상 지원 안한다고 합니다.







import numpy as np
from xgboost import XGBClassifier
from bayes_opt import BayesianOptimization
from sklearn.model_selection import cross_val_score

pbounds = {  
    'learning_rate': (0.01, 0.5),  
    'n_estimators': (100, 1000), 
    'max_depth': (3, 10),
    'min_child_weight': (0, 10),    
    'subsample': (0.5, 1.0),
    'colsample_bytree': (0.5, 1.0)
    # 'reg_lambda': (0, 1000),
    # 'reg_alpha': (0, 1.0)

def lgbm_hyper_param(learning_rate, n_estimators, max_depth, min_child_weight, subsample, colsample_bytree):
    max_depth = int(max_depth)
    n_estimators = int(n_estimators)
    clf = LGBMClassifier(
        # reg_lambda=reg_lambda,        
        # reg_alpha=reg_alpha
    return np.mean(cross_val_score(clf, train_importance, train_answer, cv=5, scoring='accuracy'))   # cv 도 숫자로 작성하여, 내부적으로 (Stratified)KFold 사용함

optimizer = BayesianOptimization( f=lgbm_hyper_param, pbounds=pbounds, verbose=1, random_state=1)
optimizer.maximize(init_points=10, n_iter=100, acq='ei', xi=0.01)

위 코드를 실행하면 아래와 같은 에러가 발생합니다.

Exception                                 Traceback (most recent call last)
Cell In[44], line 34
     31     return np.mean(cross_val_score(clf, train_importance, train_answer, cv=5, scoring='accuracy'))   # cv 도 숫자로 작성하여, 내부적으로 (Stratified)KFold 사용함
     33 optimizer = BayesianOptimization( f=lgbm_hyper_param, pbounds=pbounds, verbose=1, random_state=1)
---> 34 optimizer.maximize(init_points=10, n_iter=100, acq='ei', xi=0.01)

File ~\miniconda3\Lib\site-packages\bayes_opt\bayesian_optimization.py:288, in BayesianOptimization.maximize(self, init_points, n_iter, acquisition_function, acq, kappa, kappa_decay, kappa_decay_delay, xi, **gp_params)
    286 old_params_used = any([param is not None for param in [acq, kappa, kappa_decay, kappa_decay_delay, xi]])
    287 if old_params_used or gp_params:
--> 288     raise Exception('\nPassing acquisition function parameters or gaussian process parameters to maximize'
    289                              '\nis no longer supported. Instead,please use the "set_gp_params" method to set'
    290                              '\n the gp params, and pass an instance of bayes_opt.util.UtilityFunction'
    291                              '\n using the acquisition_function argument\n')
    293 if acquisition_function is None:
    294     util = UtilityFunction(kind='ucb',
    295                            kappa=2.576,
    296                            xi=0.0,
    297                            kappa_decay=1,
    298                            kappa_decay_delay=0)

Passing acquisition function parameters or gaussian process parameters to maximize
is no longer supported. Instead,please use the "set_gp_params" method to set
 the gp params, and pass an instance of bayes_opt.util.UtilityFunction
 using the acquisition_function argument



"set_gp_params" method을 사용하라고 하는데

gpt에 물어봐도 제대로 된 코드를 주지 않아서 어려움이 있습니다.


제가 설치한 라이브러리는 아래 목록과 같습니다..

궁극적인 질문은

앞으로 파이썬은 계속 업데이트가 될텐데 그때마다

어디를 찾아봐야하는지 어떻게 검색해야하는지에 관해서도 알려주시면 감사하겠습니다..





답변 2


안녕하세요. 답변도우미입니다.

해당 에러는 다음과 같이 라이브러리의 업데이트로인한 충돌 사항으로 보여집니다. 관련 부분은 제공해드린 코드 자료에 업데이트하였습니다.


# 202402 업데이트: Bayesian Optimization 라이브러리에서는 maximize 메소드의 사용법이 변경되어

# maximize() 메서드에서 acq 와 xi 를 직접 설정시 에러가 납니다. 따라서 해당 코드를 삭제하였습니다.

# 기존 코드: optimizer.maximize(init_points=10, n_iter=100, acq='ei', xi=0.01)

# maximize 메소드 호출

optimizer.maximize(init_points=10, n_iter=100)


pandas, scikit-learn 는 대형 라이브러리라서, 해당 라이브러리 사용시 해당 라이브러리가 내부적으로 사용하는 다른 라이브러리와의 버전 매칭에 따라서, 다양한 에러가 날 수 있습니다. 가장 확실한 것은 내부적으로 사용하는 라이브러리의 버전까지 정확히 맞추는 것인데요. 그럼에도 각각의 버전별 사용법이 다르거나, 심지어 버그가 있는 경우도 있어요. 그래서 주요 기능이 아니라 이와 같이 edge 에 가까운 기능을 사용하다보면, 완벽히 모든 기능이 동작하지 않을 수는 있습니다.


저희 같은 경우에는 주요 기능이 아니라면, 어느 정도는 그럴 수 있다는 점을 감안하고 사용을 합니다. 관련 부분이 이슈가 있는지등은 gpt 뿐만 아니라, 구글로 에러 메세지등을 검색하여 찾아내는 것이 일반적입니다. 그래서 gpt + 구글 검색을 둘다 사용하시는 것을 추천드립니다.



안녕하세요, 인프런 AI 인턴입니다.
startup_edu2님의 질문에 답변드리겠습니다.

Bayesian Optimization 라이브러리에서 maximize 메서드는 기존의 파라미터 입력 방식이 아닌 UtilityFunction 클래스를 이용하여 입력을 받도록 변경되었습니다. 따라서 간단히 코드를 수정하여 optimizer.maximize를 수행할 수 있도록 하겠습니다.

from bayes_opt import BayesianOptimization, UtilityFunction

# 기존 코드의 나머지 부분은 동일하게 유지합니다.

# UtilityFunction 인스턴스를 생성합니다.
utility = UtilityFunction(kind="ei", xi=0.01, kappa=None)

# optimizer.maximize 호출 시, instantiation 파라미터에 utility 인스턴스를 넘깁니다.
optimizer.maximize(init_points=10, n_iter=100, acq=utility)

이렇게 수정하시면 기존의 maximize 메서드 사용에 대한 문제를 해결할 수 있습니다.

파이썬이나 라이브러리의 업데이트에 따른 변경사항을 확인하는 방법으로는 다음과 같은 접근 방법을 추천드립니다:

  1. 라이브러리 공식 문서 확인: 라이브러리의 공식 문서는 가장 신뢰성 있는 정보를 제공합니다. 업데이트 내역, 변경 사항, 사용 방법 등이 자세히 기술되어 있습니다.
  2. 릴리스 노트/체인지로그 참고: GitHub 등의 저장소에서 제공되는 릴리스 노트나 체인지로그를 통해 해당 버전에서 바뀐 사항들을 파악할 수 있습니다.
  3. 커뮤니티 활용: Stack Overflow, Reddit, 라이브러리 관련 포럼 등에서 해당 라이브러리의 업데이트에 대한 토론을 찾아볼 수 있습니다.
  4. 관련 블로그나 기사 검색: 때때로 기술 블로그나 기사에서 라이브러리 업데이트에 대한 설명을 쉽게 풀어쓴 글을 찾을 수 있습니다.

각 라이브러리나 프레임워크의 변화를 빠르게 파악하고, 중요한 업데이트 내용을 적용하는 것은 개발자로서의 중요한 능력 중 하나입니다. 지속적으로 학습하면서 경험을 쌓아나가시길 바랍니다.

