월 19,800원
5개월 할부 시다른 수강생들이 자주 물어보는 질문이 궁금하신가요?
- 해결됨[개정판] 파이썬 머신러닝 완벽 가이드
export_graphviz
export_graphviz() API에 파라미터로 class_names와 ffeature_names를 직접 입력 해주셨는데 입력을 따로 안해도 똑같이 실행이 되더라구요 파라미터를 직접 넣어주신 이유가 있으신가요?
- 해결됨[개정판] 파이썬 머신러닝 완벽 가이드
warnings
warnings 를 쓰시길래 찾아봤더니 경고 제어 모듈이라고 하더라구요 모듈 설명을 읽어봐도 잘 이해가 되지않아 왜 warnings 함수를 쓰신것인지 궁금합니다
- 해결됨[개정판] 파이썬 머신러닝 완벽 가이드
smote 설치 오류 (과거 등록된 답변대로 실행시 설치 불가)
imblearn 설치를 위해 과거 2021년3월 답변 내용 참고하여 실행했는데 설치가 안되어 문의드립니다. 과거 게시판 내용 참고 https://www.inflearn.com/questions/178321 실행한 내용 pip install scikit-learn==0.23.1 pip install imbalanced-learn==0.7.0 현재 sk-learn 버전 1.0.2 오류 메시지 {(base) C:\Windows\system32>pip install scikit-learn==0.23.1 WARNING: Retrying (Retry(total=4, connect=None, read=None, redirect=None, status=None)) after connection broken by 'SSLError(SSLCertVerificationError(1, '[SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: unable to get local issuer certificate (_ssl.c:1129)'))': /simple/scikit-learn/ WARNING: Retrying (Retry(total=3, connect=None, read=None, redirect=None, status=None)) after connection broken by 'SSLError(SSLCertVerificationError(1, '[SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: unable to get local issuer certificate (_ssl.c:1129)'))': /simple/scikit-learn/ WARNING: Retrying (Retry(total=2, connect=None, read=None, redirect=None, status=None)) after connection broken by 'SSLError(SSLCertVerificationError(1, '[SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: unable to get local issuer certificate (_ssl.c:1129)'))': /simple/scikit-learn/ WARNING: Retrying (Retry(total=1, connect=None, read=None, redirect=None, status=None)) after connection broken by 'SSLError(SSLCertVerificationError(1, '[SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: unable to get local issuer certificate (_ssl.c:1129)'))': /simple/scikit-learn/ WARNING: Retrying (Retry(total=0, connect=None, read=None, redirect=None, status=None)) after connection broken by 'SSLError(SSLCertVerificationError(1, '[SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: unable to get local issuer certificate (_ssl.c:1129)'))': /simple/scikit-learn/ Could not fetch URL https://pypi.org/simple/scikit-learn/: There was a problem confirming the ssl certificate: HTTPSConnectionPool(host='pypi.org', port=443): Max retries exceeded with url: /simple/scikit-learn/ (Caused by SSLError(SSLCertVerificationError(1, '[SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: unable to get local issuer certificate (_ssl.c:1129)'))) - skipping ERROR: Could not find a version that satisfies the requirement scikit-learn==0.23.1 (from versions: none) ERROR: No matching distribution found for scikit-learn==0.23.1 Could not fetch URL https://pypi.org/simple/pip/: There was a problem confirming the ssl certificate: HTTPSConnectionPool(host='pypi.org', port=443): Max retries exceeded with url: /simple/pip/ (Caused by SSLError(SSLCertVerificationError(1, '[SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: unable to get local issuer certificate (_ssl.c:1129)'))) - skipping } {(base) C:\Windows\system32>pip install imbalanced-learn==0.7.0 WARNING: Retrying (Retry(total=4, connect=None, read=None, redirect=None, status=None)) after connection broken by 'SSLError(SSLCertVerificationError(1, '[SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: unable to get local issuer certificate (_ssl.c:1129)'))': /simple/imbalanced-learn/ WARNING: Retrying (Retry(total=3, connect=None, read=None, redirect=None, status=None)) after connection broken by 'SSLError(SSLCertVerificationError(1, '[SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: unable to get local issuer certificate (_ssl.c:1129)'))': /simple/imbalanced-learn/ WARNING: Retrying (Retry(total=2, connect=None, read=None, redirect=None, status=None)) after connection broken by 'SSLError(SSLCertVerificationError(1, '[SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: unable to get local issuer certificate (_ssl.c:1129)'))': /simple/imbalanced-learn/ WARNING: Retrying (Retry(total=1, connect=None, read=None, redirect=None, status=None)) after connection broken by 'SSLError(SSLCertVerificationError(1, '[SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: unable to get local issuer certificate (_ssl.c:1129)'))': /simple/imbalanced-learn/ WARNING: Retrying (Retry(total=0, connect=None, read=None, redirect=None, status=None)) after connection broken by 'SSLError(SSLCertVerificationError(1, '[SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: unable to get local issuer certificate (_ssl.c:1129)'))': /simple/imbalanced-learn/ Could not fetch URL https://pypi.org/simple/imbalanced-learn/: There was a problem confirming the ssl certificate: HTTPSConnectionPool(host='pypi.org', port=443): Max retries exceeded with url: /simple/imbalanced-learn/ (Caused by SSLError(SSLCertVerificationError(1, '[SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: unable to get local issuer certificate (_ssl.c:1129)'))) - skipping ERROR: Could not find a version that satisfies the requirement imbalanced-learn==0.7.0 (from versions: none) ERROR: No matching distribution found for imbalanced-learn==0.7.0 Could not fetch URL https://pypi.org/simple/pip/: There was a problem confirming the ssl certificate: HTTPSConnectionPool(host='pypi.org', port=443): Max retries exceeded with url: /simple/pip/ (Caused by SSLError(SSLCertVerificationError(1, '[SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: unable to get local issuer certificate (_ssl.c:1129)'))) - skipping}
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
개정판이랑, 이전 책 차이
안녕하세요 책은 예전에 구매했어서 2021년도 버전인데 2022년도 버전으로 또 나왔더라고요 강의는 어제 구매하여 2022년도 버전인데 2021 버전의 책을 보면서 2022 버전의 강의를 보는데 큰 무리는 없을까요?
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
Positive 칼럼만 추출한 이유
5:04 초에 positve의 확률 컬럼만 추출한 이유가 있나요?
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
책 ebook
혹시 책을 이북으로도 출간하실 계획이 있으신가요?
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
XGBRegressor 에러
강사님, XGBRegressor 및 LGBMRegressor 불러올 때, 하단과 같이 에러가 뜨는데, 버전문제인가요?! from xgboost import XGBRegressor from lightgbm import LGBMRegressor -> No module named 'xgboost'
- 해결됨[개정판] 파이썬 머신러닝 완벽 가이드
F1 스코어
책 166 ~167 쪽에 F1 스코어는 정밀도와 재현율이 어느 한쪽으로 치우치지 않는 수치를 나타낼 때 상대적을 높은 값을 가진다고 써있는데 167쪽에 분류 결정 임곗값 표를보면 0.6일 때 왜 더 좋은 성능 지표를 보여주는지 모르겠습니다 어느 한쪽으로 치우치지 않는 수치를 가질 때 더 좋은 값을 가진다면 분류 결정 임곗값이 0.45일 때 제일 좋은 값을 보여줘야 하는거 아닌가요? 그리고 임곗값이 0.6일 때가 임곗값 0.4~ 0.6 중에 제일 좋은 성능지표라고 말할 수 있는건가요?
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
PCA 2번째 주성분 추출 관련
안녕하세요 선생님. 강의 정말 잘듣고 있습니다. 궁금한 것이 하나 있습니다. PCA가 항상 변동성이 큰 방향으로 축을 삼고 주성분으로 분류한다고 하셨는데, 1번째 주성분을 선택하는 경우는 명확해 보입니다. 다만, 2번째 주성분을 구할때는 1번째 주성분 축의 직교가 되는 방향으로 구합니다. 직교방향이 반드시 2번째로 변동성이 큰 방향인지 궁금합니다. 3번째, 4번째 등도 직교=큰변동성 논리가 계속 유지되는지도 궁금합니다.
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
mean_squared_log_error()에 대해 질문드립니다.
해당 강의를 학습하면서 책 p.367을 보고 의문이 생겨 질문 드립니다. rmsle를 구현할 때 mean_squared_log_error를 사용하지 않고 직접 함수를 구현하여 사용하였는데 두 방법의 차이를 알고 싶습니다.
- 해결됨[개정판] 파이썬 머신러닝 완벽 가이드
분류 결정 임곗값
정밀도와 재현율의 트레이드오프(Trade off) - 01 6분 33초에서 임곗값이 낮을수록 Positive 로 예측할 가능성이 높아져 FN은 예측 자체를 시도하는 횟수가 적어지기 때문에 낮아지고 FP는 반대로 예측 자체를 시도하는 횟수가 많아져 FP가 증가한다 따라서 재현율은 증가하고 정밀도는 낮아진다 라고 이해 했는데 Positive로 예측하는 횟수가 많아지면 TP 역시 증가하게 되서 정밀도 = TP / ( FP + TP ) 가 모두 같이 증가하기 때문에 정밀도가 낮아지진 않을거같은데 왜 임곗값을 낮추면 정밀도가 낮아지는건지 궁금합니다 ! 또 다른 타 강의 에서는 특이도(Specificity)도 다루던데 따로 안다루시는 이유가 있으신지도 궁금합니다 !
- 해결됨[개정판] 파이썬 머신러닝 완벽 가이드
평가지표와 피쳐, 정확도
1. "정확도 평가 지표는 불균형한 레이블 데이터 세트에서는 성능 수치로 사용되서는 안된다" 라고 책 150 페이지에 나와있는데 "불균형한 레이블 데이터 세트"에는 이진분류만 해당하는건가요? 2. 평가지표는 레이블 값의 여부로만 따져서 평가하나요? 예를 들어 피처값이 불균형한 데이터로, 레이블 값이 불균형한 데이터가 아닐 경우로 되어 있다면 정확도로 평가를 해도 문제가 없는건가요? 평가는 오로지 레이블 데이터 값의 여부에 따지는 것인지 궁금합니다!
- 해결됨[개정판] 파이썬 머신러닝 완벽 가이드
오차행렬
오차행렬 파트에서 Negative로 예측했기 때문에 TP,FP 모두 0이라고 책에 써져 있던데 Negative로 예측하게 만들어준 코드가 어디에 있는건가요? 어떤 과정을 걸쳐서 Negative로 예측하게 된건지 잘 이해하지 못하겠습니다 ! 또 Negative만으로 예측해서 정확도에 문제가 생긴건지도 궁금합니다 !
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
KFold를 사용하는 이유와 roc_auc가 더 높게 나오는 이유가 뭔가요..?
안녕하세요. 강의 내용 중 교차검증에서 질문이 있어 글을 남깁니다. 이전에 Stratified K 폴드는 불균형한 분포도를 가진 레이블 데이터 집합을 위한 K폴드 방식이라고 설명해주시면서 책에도 '왜곡된 레이블 데이터 세트에서는 반드시 Stratified K폴드를 이용해 교차 검증해야 합니다. 사실, 일반적으로 분류에서의 교차 검증은 K폴드가 아니라 Stratified K폴드로 분할돼야 합니다.' 라고 돼있는데 1. 여기서도 '만족 고객보다 불만족 고객이 훨씬 많은 불균형 데이터임에도 XGBClassifier와 LightGBM을 search_space값으로 교차검증할 때, StratifiedKFold가 아닌 KFold로 교차검증을 하는 특별한 이유가 있을까요..? 또, 실제로 제가 기존 소스코드에서 KFold가 아닌 Stratified로 돌렸을 때 2. XGB같은 경우 Stratified K폴드는 0.8456, KFold는 0.8457의 roc_auc값을 갖고, LightGBM 같은 경우 Stratified K폴드는 0.8411, KFold는 0.8446으로 두 모델 모두 KFold로 교차검증을 진행했을 때 더 높은 roc_auc값을 갖는 이유가 무엇인지 알 수 있을까요..? 제가 Stratified KFold와 KFold에 대해 잘못 이해하고 있는 것인지, 이런 경우에는 적용할 필요가 없는 것인지 알고 싶습니다 ㅠㅠ
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
오류발생 4장 HyperOpt 기본실습 오류방생에 대한 질문답변부탁드립니다.
아래 문구로 구글링을 해봤는데 마땅한 해결방법을 찾지 못하였습니다.
- 해결됨[개정판] 파이썬 머신러닝 완벽 가이드
Accuracy
평가의 정확도 강의 중에 불균형한 데이터(대출 사기등)에서는 정확도가 알맞는 측정방법이 아니라고 하셨는데 불균형한 데이터를 균형하게 학습시켜 주기 위해 StratifiedKFold를 사용하는거 아닌가요?? StratifiedKFold를 이용해 정확도를 측정해주면 될텐데 왜 불균형한 데이터에서 사용하지 않는것인지 궁금합니다 !
- 해결됨[개정판] 파이썬 머신러닝 완벽 가이드
선형회귀 예측값 데이터 크기 관련 질문 드립니다!
원본 데이터는 (41,1908)의 shape을 가지고 있고, train_test_split(X,y, test_size=0.2)함수를 통해서 X_train(32,1907) X_test(9,1907) y_train(32,1) y_test(9,1)의 값을 가지고 lr = LinearRegression() lr.fit(X_train, y_train_) y_preds = lr.predict(X_train) 을 수행했습니다. 여기서 문제점이 생겼는데 LinearRegression 모델을 사용해서 전체 row 항목들에 대한 (41,1)의 형태를 가지는 target값 예측을 수행하고싶은데 위와 같은 코드를 수행하면 y_preds는 (9,1)의 형태로 반환 되더군요.. fit으로 학습을 통해 예측된 (41,1) 형태의 새로운 target값을 반환하려면 어떤식으로 코드를 짜야할까요 ..?
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
DataFrame Groupby 시 Aggregation 관련
안녕하세요? 강의 잘 듣고 있습니다. DataFrame Groupby 시 Aggregation 을 위해 dictionary 를 적용하는 경우, 동일한 key 값에 두 가지 function 을 할당하여 생기는 문제에 대한 해결책으로 named aggregation 을 사용하셨는데요, 리스트를 사용하는 것이 좀 더 간단하지 않을까요? 예) agg_format = {'Age' : 'max', 'Age' : 'mean' , 'Fare' : 'mean' } titanic_df.groupby('Pclass').agg(agg_format) 위와 같이 사용할 경우 'Age' 키값에 'max' 가 조회되지 않는 문제가 있지만, agg_format = {'Age' : ['max' ,'mean'] , 'Fare' : 'mean' } 이와 같이 list를 value 값으로 주면 named aggregation 보다 코드가 간결해지며, display 시 max, mean 등 함수명이 column에 표기되므로 시각적으로도 더 나아 보입니다. 또한, 하나의 Aggregation 함수만 사용하는 경우에도, 아래와 같이 리스트를 사용하면 각 Column에 적용된 함수가 무엇인지 명시적으로 display 되게 할 수 있습니다. agg_format = {'Age' : ['max' ] , 'Fare' : ['mean'] }
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
for ~ in kfold.split(): 역할
안녕하세요 선생님 학습중에 의문점이 생겨 문의드립니다. 우선 KFold(n_splits=5) 로 폴드의 개수를 5개로 설정했기 때문에 shuffle 설정을 안하기 때문에 인덱스 순서로 120개의 피처와 30개의 레이블이 생성된다는 점은 알겠는데, for 반복문을 돌 때 30개의 레이블이 자동으로 각 폴드를 건너뛰는 점이 이해가 잘안되는데 쉽게 설명해주실 수 있을까요..
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
KMeans 군집화 실습 강의 01과 02가 같은 동영상으로 업로드 된것 같습니다
KMeans 군집화 강의에서 '사이킷런을 이용한 K-Means군집화 실습 01과 02' 동영상이 같은 동영상으로 업로드된것 같은데 한번 확인부탁드립니다!