66,000원
다른 수강생들이 자주 물어보는 질문이 궁금하신가요?
- 미해결캐글 Advanced 머신러닝 실전 박치기
LightGBM 외의 다른 모델에도 사용가능한가요?
좋은 강의 감사합니다. 강의에서 보면 Bayesian Optimization은 black box 함수 내에서 최소값이나 최대값을 찾는 기능을 하는 것 같던데, 이것은 LightGBM외의 model, 예를 들어서 DecesionTreeClassifier, RandomTree, xgboost 등에도 가능한가요? 그리고 최대 최소를 구할 때 꼭 값을 roc_auc_score가 아닌 f1_score, accuracy를 사용할 수 도 있나요?
- 미해결캐글 Advanced 머신러닝 실전 박치기
lgb_roc_eval 함수 내에서 params에 대해 min, max 설정 질문
안녕하세요, 강의 내용 중 lgb_roc_eval에서 'subsample':max(min(subsample, 1), 0), 'colsample_bytree': max(min(colsample_bytree, 1), 0), 'max_bin': max(int(round(max_bin)),10), 'reg_lambda': max(reg_lambda,0), 'reg_alpha': max(reg_alpha, 0) 이 부분의 경우, 꼭 min, max 설정이 필요한 것인지요? 가령 subsample의 경우 0.5~1에 해당하는 값이 들어오기 때문에 당연히 0보다는 크고 1보다는 작은 값이 되는데 예를 들어 0.6이 되었다고 할 경우, max(0.6, 0) 가 되어 당연히 0보다는 큰 값이 되는데 이들 min, max를 꼭 설정할 필요가 있는 것인지 궁금합니다! 제가 놓치고 있는 부분이 무엇인지 알고 싶습니다~! 감사합니다.
- 미해결캐글 Advanced 머신러닝 실전 박치기
l1이 l2보다 overfitting 제어에 도움이 되는 이유
안녕하세요, 강의에서 'l1이 l2보다 overfitting 제어에 더 도움이 된다.' 라고 하셨는데 혹시 어떤 이유 때문인지 알 수 있을까요? 감사합니다.
- 미해결캐글 Advanced 머신러닝 실전 박치기
Squeeze=False를 사용하는 이유
안녕하세요, 혹시 subplots 생성시 squeeze=False를 사용하는 이유가 무엇인지 알 수 있을까요? 감사합니다.
- 미해결캐글 Advanced 머신러닝 실전 박치기
bayesian optimization CV 코드 문의
bayesian optimization cv 코드('hyper_param_tuning_01'에서 몇개의 실습코드가 중간에 빠진 것 같습니다. lgb_roc_eval_cv 함수 지정 후 실제 함수를 시행하고 반환값을 받아서 'target' 에 해당하는 값들을 다시 리스트의 형태로 저장하는 코드가 중간에 빠진 듯 합니다. --------------------------------------------------------------------------------------------------- lgbBO = BayesianOptimization(lgb_roc_eval_cv, bayesian_params, random_state = 0) lgbBO.maxmize(init_point = 5, n_iters = 25) -------------------------------------------------------------------------------------------------------- result_list = [] for result in lgbBO.res: target = result['target'] result_list.append(target) print(result_list) print('max result:', np.argmax(np.array(result_list))) ------------------------------------------------------------------------------------------------------- 위의 두 가지 코드가 들어가야 새로이 실행된 CV 함수의 반환값에 대하여 최대값을 반환하는 듯 한데요?
- 미해결캐글 Advanced 머신러닝 실전 박치기
prev_baseline_01 간단한 질문이 있습니다.
prev_baseline_01 복습 중 연속형 변수의 EDA 그래프에 대해 질문이 있어서 글 남깁니다. 선생님께서 'AMT_ANNUITY, AMT_CREDIT, AMT_APPLICATION, AMT_GOODS_CREDIT는 TARGET=1일 경우에 소액 비율이 약간 높음(큰 차이는 아님)' 이라로 적어 주셨는데 TARGET=0일 경우에 소액 비율이 약간 높은 것이 아닌가요?
- 미해결캐글 Advanced 머신러닝 실전 박치기
correlation과 Feature importance의 관계 문의
안녕하세요. 강사님. 항상 상세하고 깊은 이해에 닿을 수 있도록 답변해 주셔서 감사합니다. 강의 중에 Target과 Feature 간에 Correlation Heatmap도 그리는 작업도 했었는데, correlation이 낮은데도 Feature importance가 높은 경우가 꽤 있는 것 같아 문의드립니다. 상식적으로 생각하면 target과의 correlation이 큰 Feature들이 feature importance도 높을거라 생각됩니다.(target과의 상관계수가 높은 Feature가 0과 1로 target을 split할 때 많이 인용될 것이므로) 그런데 아래 히트맵과 Feature importance를 볼 때, DAYS_BIRTH는 EXT_SOURCE 1, 2보다 상관계수가 절반임에도 Feature importance가 높습니다. 개인 프로젝트를 진행할 때는 이보다 훨씬 극적인 케이스들도 접하여 문의드립니다.(correlation이 0에 가까운데 Feature importance는 최상위권인 경우) 어떻게 이런게 가능할까요? correlation이 높다고 Feature importance가 높지 않을 수 있는게 신기합니다.
- 미해결캐글 Advanced 머신러닝 실전 박치기
히스토그램의 y축 의미 질문
안녕하세요. 시각화 우측에 히스토그램에서 y축이 의미하는 것이 무엇인지요? X축은 AMT_CREDIT 값일텐데 y축은 어떻게 해석해야 하는지 궁금합니다. AMT_CREDIT을 예로 들면 단위가 1e-6 라서 단순히 비중(x축의 bin이 전체의 몇%를 차지하는지)은 아닌 것 같고, density 인가 추측해봅니다. 위와 별개로 kde 에서 density의 의미를 찾아봤으나 정확히 이해가 어려운데 설명해주실 수 있는지요?
- 미해결캐글 Advanced 머신러닝 실전 박치기
이자
이자구할때 -1은 왜들어가나요? 풀어서 설명좀 부탁드립니다.
- 미해결캐글 Advanced 머신러닝 실전 박치기
대용량 데이터일 때 apply 대체 함수
안녕하세요! 새해복 많이 받으세요! 질 좋은 강의에 감사 인사 드립니다. 다름이 아니라 Feature engineering 과정 중에서 데이터가 천만을 넘어 억 단위로 넘어갔을 때, 특정 칼럼의 값을 특정 조건에 맞춰 변경하고자 할 때 주로 apply & lambda를 사용하시 잖아요!? 강의 중에 데이터가 대용량으로 갈수록 apply 함수가 작업 완료시 까지 시간이 많이 소요된다고 하셨습니다!(apply함수가 일일이 하나의 row마다 바꿔주는 작업을 해준다고..) 그렇다면 몇 천만, 억 단위의 데이터 개수까지 가게 되면 apply 함수 대신 사용하는 것이 있나요...? numpy를 이용하면 좀 빠를려나요? 아니면 다른 대체 함수를 찾을 것이 아니라 로컬(또는 클라우드 VM)의 성능을 높여야 하나용..?(GPU라든가..등..)
- 미해결캐글 Advanced 머신러닝 실전 박치기
Bayesian Optimization 기반 LightGBM 하이퍼 파라미터 튜닝 실습코드가 첨부된 수업자료에 없습니다.
Bayesian Optimization 기반 LightGBM 하이퍼 파라미터 튜닝 실습코드가 첨부된 수업자료에 없습니다. 'Bayesian Optimization 개요 및 실습' 강의 영상의 수업자료를 찾을 수 가 없네요 확인부탁드립니다.
- 미해결캐글 Advanced 머신러닝 실전 박치기
def함수에서 이해가 가지 않는 부분이 있습니다.
해당 함수에서 is_amt가 true이면 필터링 조건 넣는 곳이 이해가 가질 않습니다. is_amt가 true이면 if is_amt=True: cond_amt=df[column]<500000 이라고 생각했는데 적어주신 조건은 어떻게 되는건지 이해가 가질 않습니다.
- 미해결캐글 Advanced 머신러닝 실전 박치기
merge관련 질문입니다.
안녕하세요! Series형인 'A'와 DataFrame 형인 'B'를 merge한다고 했을때 merge가 내부적으로 'A'를 DataFrame형으로 바꾸고 reset_index도 해주는 것 인가요?
- 미해결캐글 Advanced 머신러닝 실전 박치기
training과 valid 데이터의 auc 질문
안녕하세요. training과 valid 데이터의 auc 값에 대해 문의드립니다. valid 데이터의 auc가 0.8 이라는 것은 target 값을 0.8 확률로 맞춘다는 뜻인지요?
- 미해결캐글 Advanced 머신러닝 실전 박치기
그래프와 주피터노트북사용법 질문입니다.
안녕하세요. 1.사진처럼 apps_train을 apps_train1으로 변경하려고 할 때 위에 셀에 있는 변수를 변경하면 아래 셀에 있는 변수도 자동적으로 변경할 수 있는 단축키가 있나요? 비주얼 스튜디오 코드 Ctrl + Shift + L처럼 다중 선택해서 변수명 수정하는것처럼요. 혹시 주피터 노트북에서는 변수명을 변경하고 싶을 때 하나하나씩 변수명을 변경해야 하나요? 2.또 app_baseline_01에 전체 코드를 app_baseline_02에 붙여넣고 싶을 때 app_baseline_01에 C를 누르고 app_baseline_02에서 V를 누르면 아무것도 작동이 안되서요. 어떻게 해야 하나요? 3. 위에 사진처럼 꺽은선 그래프를 만들 때 값이 왼쪽으로 심하게 치우져져있습니다. 혹시 값을 오른쪽으로 옮길 수 있는 방법이 있을까요? 아래는 꺽은선형 코드입니다. corr_columns[['EXT_SOURCE_2', 'EXT_SOURCE_3']].plot(x='EXT_SOURCE_2', linestyle='-', marker='o', ax=ax, color=colors[2])
- 미해결캐글 Advanced 머신러닝 실전 박치기
데이터 셋 가공 질문입니다.
안녕하세요. 주피터 노트북에서 application test파일불러온 후 EXT_SOURCE_3의 열의 데이터 가공을 할 떄 데이터가 변경이 되는데요. 예를들어 수치값을 --원 이런식으로 나타나게 하고 싶습니다. 만약에 예시와 같은 행동을 취할 시 int->str로 변경되서요, 그래서 생각한게 깊은복사를 하여 데이터셋을 복사한 후 복사한 데이터가지고 가공할려고 하여 아래와 같이 적었습니다. import copy b = copy.deepcopy(['EXT_SOURCE_3의 ']) 하지만 기본데이터(원래 다운받은 데이터)에서 변경이 됩니다. 혹시 예시와 같은 해동을 했을 때 다시 원형 데이터로 되돌릴 수 있는 방법이 있나요? 아니면 데이터 전체열은 깊은 복사가 안되는 건지 궁금합니다.
- 해결됨캐글 Advanced 머신러닝 실전 박치기
실습환경 관련
안녕하세요, 제가 가진 컴퓨터가 14코어 28스레드, 128Gb RAM, 1070Ti x 2 SLI 정도의 스펙을 가지고 있습니다. 제가 원하는 것은 그래픽카드의 코어수를 최대한 활용하고 싶은 것입니다. 각 분석방법 등에서 쿠다가속을 활용할 수 있는 방법이 있을까요? LightGBM 같은 경우는 제 나름 검색을 해보고 쿠다를 설치하고 그래픽 버전으로 설치를 했습니다.
- 해결됨캐글 Advanced 머신러닝 실전 박치기
수치 데이터의 경우 도메인을 정의할 수 있나요?
안녕하세요. 제가 주로 다루는 데이터는 특정 지역에서 나타난 어떠한 것들의 개수 인데요. 이런 수치데이터만 있는 경우는 도메인, 데이터 수집과 가공이 잘 매치가 안되는데 수치만 있는 데이터들도 도메인을 정의하고 데이터가공이 가능한지 궁금합니다.
- 미해결캐글 Advanced 머신러닝 실전 박치기
-bash vi : command not found
안녕하세요. vi 를 실행시켰을 때 제목과 같은 에러가 발생해서 질문 남깁니다. 구글에서 찾아서 이것저것 해봤는데 해결하지 못한 상황입니다. 혹시 방법을 아시는지 궁금합니다. apt-get install vi 경우 권한이 없다는 에러가 나오는데 관리자 권한으로 들어가있음에도 이러한 에러가 발생합니다.
- 미해결캐글 Advanced 머신러닝 실전 박치기
피쳐설명 파일은 어디서 다운받나요?
피쳐설명 파일은 어디서 다운받을수 있나요?...