월 19,800원
5개월 할부 시다른 수강생들이 자주 물어보는 질문이 궁금하신가요?
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
범주형 변수 클러스터링
안녕하십니까 교수님 군집화에서 질문이 있어 글을 남기게 되었습니다. 군집화는 거리를 기반하여 유사도를 측정하는 머신러닝 기법이라고 배웠습니다,그럼 카테고리컬 변수의 경우 어떤식으로 클러스터링을 할 수 있을까요?구글링을 해 보니 k-modes라는 것이 있던데.. 연속형 변수와 범주형 변수 데이터를 모두 고려한 클러스터링 방법이 있을까요? 항상 감사합니다.
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
교차 검증 시에 계수나 규칙이 계속 바뀌는건가요?
안녕하세요 교차검증에 대해 잘 이해가 안되서요 ㅠㅠ만약 3번 교차검증을 한다했을 때첫번째 학습을 하고 나서 두번째 학습시에 첫번째 모델을 기반으로 분류라면 분류규칙이라든지 회귀라면 회귀계수가 변경이 된고 셋번째 학습시에 두번째 모델을 기반으로 변경이 계속 되는건가요?
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
gridsearchcv관련 간단한 질문이 있습니다.
안녕하십니까, 많이 배우고 있습니다.질문 : GridSearchCV의 경우 k-fold만 사용 하는 것 같은데, stratified k-fold는 사용할 수 없나요? 아래는 chat gpt가 stratified k-fold 사용법을 알려줬는데 아래와 같이 사용하면 되는지 여쭙습니다. from sklearn.model_selection import StratifiedKFold, GridSearchCV from sklearn.svm import SVC # 예제 데이터와 모델 X, y = load_your_data() # 데이터를 로드하거나 생성하는 코드 model = SVC() # 사용할 모델 # Stratified K-Fold 교차 검증 설정 stratified_kfold = StratifiedKFold(n_splits=5, shuffle=True, random_state=42) # 그리드 서치 설정 param_grid = { 'C': [0.1, 1, 10], 'kernel': ['linear', 'rbf'] } grid_search = GridSearchCV(estimator=model, param_grid=param_grid, cv=stratified_kfold) # 그리드 서치 수행 grid_search.fit(X, y) # 최적의 매개변수와 결과 출력 print("Best parameters found: ", grid_search.best_params_) print("Best cross-validation score: {:.2f}".format(grid_search.best_score_)) 위 코드에서는 StratifiedKFold를 GridSearchCV의 cv 매개변수에 전달하여 Stratified K-Fold 교차 검증을 수행하고 있습니다. 따라서 그리드 서치는 Stratified K-Fold 교차 검증을 사용하여 모델의 성능을 평가합니다. StratifiedKFold의 n_splits 매개변수는 원하는 폴드 수를 지정할 수 있습니다.이렇게 하면 그리드 서치를 Stratified K-Fold 교차 검증과 함께 사용하여 클래스 간 분포를 고려한 모델 평가를 수행할 수 있습니다.
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
uci human activity recognition dataset 에 대한 내용
강사님 안녕하세요! 이제 막 강의를 듣기 시작한 학생입니다. 다름이 아니라 Human Activity Recognition Using Smartphones - UCI Machine Learning Repository이 사이트가 바뀌어서 dataset를 어디서 다운 받을지 모르겠습니다 어디로 가야할지 알려주실 수 있나요 ?
- 해결됨[개정판] 파이썬 머신러닝 완벽 가이드
GridSearchCV 질문 드립니다!
GridSearchCV의 best_score_ method를 이용하면 교차검증을 통해 최적의 하이퍼파라미터 조합을 찾아서 가장 높은 score를 반환하는 것으로 알고 있습니다. 다만 여기서 scoring 하이퍼파라미터 설정을 안한다면 반환되는 best_score_는 무엇이 되는건가요? accuracy가 디폴트인가요? best_score_floatMean cross-validated score of the best_estimatorFor multi-metric evaluation, this is present only if refit is specified.This attribute is not available if refit is a function. 공식문서에서는 이렇게 나오는데, 여기에서도 score를 어떻게 정의하는지에 대해 구체적으로 나와있지 않았습니다. GridSearchCV를 사용하는데 있어서, 디폴트로 반환하는 .best_score_값이 무엇인지 정확히 무엇인지 궁금합니다! 긴 글 읽어주셔서 감사합니다 :) 오늘도 좋은 하루 보내시길 바랍니다!
- 해결됨[개정판] 파이썬 머신러닝 완벽 가이드
random_state에 관해 질문드립니다
일반적으로 train_test_split() 함수에 random_state를 지정하는 이유는 학습 데이터셋과 테스트 데이터셋을 분리할 때 매 수행마다 동일한 데이터셋으로 분리하기 위함이라고 알고 있습니다. 그런데 DecisionTreeClassifier()객체를 생성할 때 안에 random_state를 넣어주는 이유는 무엇인가요? DeicisonTreeClassifier과 train_test_split() 둘다 random_state를 넣어줘야 하나요? 만약 그렇다면 radom_state가 각각 사용되는 의미가 다른가요? 다르다면 어떻게 다른지 여쭙고 싶습니다. 선생님, 날씨도 더운데 답변해주시느라 너무 감사합니다ㅜㅜ
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
폴드의 갯수
선생님 안녕하세요k-폴드 방식으로 데이터를 분할할 때, 최적의 k는 어떻게 구하나요?
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
비지도학습에 대한 심화 강의가 따로 있을까요?
안녕하세요 강사님, 강사님 강의를 통해 분류 및 회귀 (지도학습)에 대해 공부하며 도움을 많이 받았습니다.머신러닝 완벽 가이드에 소개된 비지도학습 내용 외에, 만들어두신 다른 강의에서 비지도학습에 대한 심화적인 학습이 가능한 것이 있을까요???"캐글 Advanced 머신러닝 실전 박치기" 강의를 눈여겨보고 있는데, 해당 강의에서 비지도 학습을 이용하여 문제를 해결하는지 여부에 대해서 알지 못하여 이렇게 문의드립니다.!감사합니다.
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
정확도 / 정밀도 높이는 방법 문의
안녕하세요 강사님!저는 2년전에, 강사님 강의를 듣고(Advanced kaggle 도 수강) 사내 해커톤 경진대회에서 대상을 수상하였던 수강생입니다.이번에도 해커톤을 나가게 되었는데정확도 / 정밀도 모두 심사기준입니다.혹시 이 둘을 같이 높일 수 있는 방법이 있다거나기타 다른 팁이 혹시 있을까요..?감사합니다.
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
규제 적용시 cross_val_score NaN반환
- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 강의 내용을 질문할 경우 몇분 몇초의 내용에 대한 것인지 반드시 기재 부탁드립니다. - 서로 예의를 지키며 존중하는 문화를 만들어가요. - 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요. 안녕하세요.규제 부분 코드 실습 중 규제 클래스에 관해서 cross_val_score적용 시 NaN값이 반환되는 것이 확인되어 질문드립니다. 싸이킷런 버전의 경우 1.0.2버전인데구글링을 했을 때는, 데이터 내에 NaN값이 있어서 그럴 것이라는데 제가 확인해봤을 때는 NaN값이 없었습니다.혹시 버전과 관련된 문제일까요...?동일 코드에 Ridge클래스대신 LinearRegression클래스로 대체시 정상적으로 코드가 동작하는 것을 확인하여 우선 Ridge클래스에 대한 문제로 간주하고 있습니다...ㅠ
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
전압, 진동과 같은 데이터를 학습 및 테스트 하기 위한 방법이 궁금합니다.
- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! 안녕하세요. 우선 머신러닝에 대해 알기쉽게 강의해 주셔서 감사합니다.저는 기계의 고장진단 및 예측을 위해서 머신러닝을 공부하고 있는 직장인 입니다.다름이아니라, 실습에서 다루는 데이터는 다양한 정보들이 1개의 파일에 있어, 학습 및 테스트를 진행하였습니다. 그러나, 전압,진동과 같이 물리적 데이터는 일정시간 동안 데이터를 계측하게 되고, 이러한 파일이 여러게 존재하게 됩니다.(첨부된 그림 참조)이렇게 데이터 취득시, 현실적으로는 고장데이터를 취득한 파일 전체의 레이블이 1(1이 고장이라 하면), 정상상태를 취득한 파일은 0이 되어야 합니다.이렇듯 다수의 파일, 1개의 파일 안에 시간순으로 측정된 다수의 데이터가 있을 경우, 학습 및 테스트를 하기위한 데이터 전처리 방법이 궁금합니다.수고하세요.
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
LightGBM 4.0.0을 이용하고 있는데 수업에서 사용한 3.3.2버전과 다른점이 있나요?
'LightGBM을 이용한 위스콘신 유방암 예측'을 보고 깃허브에서 다운한 예제를 런 시켜보고 있는데 세번째에서 오류가 뜹니다. fit()함수에 early_stopping_rounds는 쓸수 없다고 나옵니다. 그래서 파라미터명이 업데이트 되었나 싶어서 인터넷에 찾아보니까 LightGBM 페이지에서는 early_stopping_rounds, early_stopping_round, 둘다 가능하다고 나옵니다. 뭐가 문제인지 모르겠습니다.
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
이전 XGBoost 혹은 GBM 등의 경우 확률적 경사 하강법을 사용하나요?
- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 강의 내용을 질문할 경우 몇분 몇초의 내용에 대한 것인지 반드시 기재 부탁드립니다. - 서로 예의를 지키며 존중하는 문화를 만들어가요. - 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요.이전 XGBoost 혹은 GBM 등에서 경사하강법에 대해서 이야기 되었을 때, 이때의 경사하강법은 확률적 경사하강법이 기반된 것이 맞을까요?
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
threshold에 따른 roc_auc curve 설정 질문드립니다.
선생님, 안녕하세요?분류모델 성능 평가지표에서 roc_auc 에 대해 궁금한 점이 생겨 질문드립니다.threshold에 따라 roc_auc_score값 구하기sklearn.metrics.roc_auc_score(y_test, pred_proba) # pred_proba = model.predict_proba()위의 코드로 roc_auc값을 구하는 것으로 알고 있습니다.하지만, 위의 코드로 roc_auc값을 구하면, threshold에 따라 달라지지 않습니다.그렇다고 pred_proba대신 pred(pred = model.predict())를 사용하면 roc_auc값이 떨어집니다.threshold에 따라 roc_auc값을 어떻게 구하면 좋을까요? 최적의 threshold를 구할 때 어떤 성능 지표를 제일 최우선으로 봐야할지도 궁금합니다. 저는 지금 질병 진단 예측을 만들고 있어 재현율을 높이는게 중요하다고 생각하는데 roc_auc값도 중요하게 봐야할 것 같아 고민이 됩니다...pred_proba, pred 둘 중 어느 것으로 roc_auc값을 구하는게 맞나요? 일반적으로 사용되는 것이 무엇인가요?답변 부탁드리겠습니다.감사합니다 :)
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
4.9실습관련 질문
4.9 실습에서1.처음 xgb_clf 객체를 생성할때, n_estimators 나 learning rate같은 파라미터 값들은 어떤값을 줘도 상관이 없을까요? 처음 분류기 모델을 생성할때 어떤값을 줘도 상관없는지 궁금합니다!그다음줄 코드 xgb_clf.fit(X_tr, y_tr, early_stopping_rounds=100, eval_metric='auc', eval_set=[(X_tr, y_tr), (X_val, y_val)]) 에서 eval_metric 을 이전 xgb실습때에는 'logloss'값을 줬는데 이번 실습에서는 roc_score를 평가지표로 사용한건가요? 학습을 시킬때, 어떤경우에는 평가지표를 어떤값을 줘야하는지 궁금합니다!목적함수 설정 부분에서 kfold방식으로 x_train을 나눈 이유가 궁금합니다!
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
다항 회귀를 이용한 보스턴 주택가격 예측실습 질문
마지막 부분에 X_train_poly 설명해주시는데 이게 모델학습하고 transform한 그냥 변수이름인건가요.영상에서 polyniaml 학습된 x라고 하셔서, 그냥 polynomfial변환하시고 데이터 학습시키신건지 헷갈리네요;
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
산탄대르 실습질문
산탄데르 은행 고객 만족 예측 실습-1에서ID 컬럼을 드롭하는데 특별한 이유가 있으신가요. 식별자라고 해서 삭제한다고 영상에서 말씀하셨는데 이유가 궁급합니다.!
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
군집화 실습 - 고객 세그멘테이션
파일을 받았는데 안열리는데 왜 그럴까요..? ㅠㅠ책으로는 군집화에서 소챕터 06입니다 ㅠㅠ
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
3장 마지막 부분 오류 ㅠㅠㅠㅠ
이 코드 왜 오류날까요 ㅠㅠㅠ 이런 식으로 오류가 나요 ㅠㅠㅠㅠㅠ
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
강의자료는 다운받을수 없나요?
안녕하세요. 강의를 잘 듣고 있습니다.유익한 강의를 해주셔서 감사합니다.강의 자료는 다운 받을 수 없나요?