월 19,800원
5개월 할부 시다른 수강생들이 자주 물어보는 질문이 궁금하신가요?
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
임계값에 따른 ROC-AUC
다른 분이 남기신 댓글을 참조했는데, 임계값에 따른 ROC-AUC는 변함이 없다고 하셨습니다.하지만 책을 참조하자면 'FPR을 0으로 만드려면 임곗값을 1로 지정해라' 혹은'TN을 0으로 만드려면 임곗값을 0으로 만들어라'처럼 임곗값에 따라서 TPR, FPR이 바뀌는데 어떻게 그 면적을 계산한 값인 ROC-AUC는 변하지 않는다고 설명이 되는거죠?
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
def구문에서 None이 들어가는 이유
안녕하세요! 강의 너무 잘 듣고 있습니다. 다름이 아니라 def get_clf_eval(y_test, pred=None, pred_proba_None): 함수를 만들 때, pred = None, pred_proba = None처럼 None이 들어가는 이유를 모르겠습니다. None 없이 하는거랑 차이가 있을까요?
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
전처리와 데이터 분할
선생님, 안녕하세요. 스케일링 파트를 보다가 의문점이 생겨서 문의 드렸습니다. 가능하다면 전체 데이터의 스케일링 변환을 적용한 뒤 학습/테스트 데이터로 분리 하라고 하셨는데 스케일링 등과 같은 전처리 과정에서 train&test data를 분할하기전에 전체 데이터에 대해서 Preprocessing 인스턴스를 갖고 fit&transform을 할 경우에 test data를 치팅한 효과, data leakage를 발생할 수 있다고 생각해서 데이터 분할 후 전처리를 하는게 맞다고 생각하는데..학습/테스트 데이터 분할 후 전처리를 해야하나요 아니면 전체 데이터로 전처리 후 분할을 해야하나요?
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
강의 자료 문의입니다.
안녕하세요.권철민 선생님 강의 너무 잘 듣고 있습니다.Classfication 완벽가이드 부터 컴퓨터 비전 수업을 듣고 머신러닝 강의를 들으러 왔어요.이번 강의도 기대가 됩니당.혹시 강의자료 따로 받아 볼 수 있을까요??자료에 필기하는게 습관이 되어서 꼭 있었으면 합니다 :)
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
정밀도를 100%로 만드는 법
1명의 확실한 P 예측과 나머지를 모두 N으로 예측했을 때 정밀도가 100%가 된다고 말씀하셨습니다.이 경우에 재현율도1 / 1+0 해서 100%되지 않나요?
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
HyperOpt
책 p.256 부분 중간쯤에 '대체모델은 최적함수를 추정할 때 다양한 알고리즘을 사용할 수 있는데 일반적으로는 가우시안 프로세스를 적용하지만, 뒤에서 상술될 HyperOpt는 가우시안 프로세스가 아닌 트리 파르젠 Estimator(TPE, Tree-Structure Parzen Estimator)를 사용한다.'고 써져있는데요.이 말은 곧 책에서 설명된 HyperOpt보다는 다른걸 더 많이 사용하고, 이것이 성능도 더 좋다는 말과 같을텐데 혹시 맞나요? 맞다면 실무에선 어떤 걸 사용하나요?
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
def predict(self, X): 에서
self가 들어가는 이유가 무엇인가요? 역할이 무엇인지, 꼭 넣어야 하는건지 궁금합니다.
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
정규화 관련 질문드립니다
수치형 변수를 0~1 사이로 정규화 했을 경우 인코딩(라벨 인코딩/원핫 인코딩)한 범주형 변수도 정규화 해야 할지 여쭤보고 싶습니다.감사합니다.
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
다항 분류 질문입니다.
다항회귀를 배우면서 궁금해진 내용인데혹시 다항 회귀처럼 여러 피처들을 곱해서 분류에 사용하는 경우가 있나요?
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
Hyperopt - rstate 질문
안녕하세요 선생님, 강의 잘 듣고 있습니다.베이지안 최적화 파트 강의에서 동일하게 코드를 작성하였는데 아래와 같은 오류가 발생했습니다. 1) 강의와 완전 동일하게 작성 (best_01)fmin(fn=objective_func, space=search_space, algo=tpe.suggest, max_evals=5, trials= trial_val, rstate=np.random.default_rng(seed=0))AttributeError: 'numpy.random._generator.Generator' object has no attribute 'randint' 2) rstate를 제거하였을 경우fmin(fn=objective_func, space=search_space, algo=tpe.suggest, max_evals=5, trials= trial_val)TypeError: ap_uniform_sampler() got multiple values for argument 'size' 넘파이를 호출했는데 randint가 없다고 하는 이유와 두번째 오류 모두 비슷한 케이스를 찾아보긴 했으나.. 이해가 잘 안갑니다. 오류의 원인을 혹시 알 수 있을까요?참고로 코랩에서 진행했습니다. 주피터 노트북도 시도해보았는데.. 주피터에서는 아이러니하게도 rstate를 포함한 코드에서 코랩의 두번째 TypeError가 떴습니다..
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
lightlgm 사이킷런 래퍼 클래스
위와같은 소스에 대한 설명이 책 p.250에는 파이썬 패키지라고 나오는데, 책에서 이전 부분에서 앞으로 사이킷런 래퍼클래스만 사용한다고 하셨고, 인강에서도 사이킷런 래퍼 클래스라고 설명하셨습니다. 위 코드도 사이킷런 래퍼 클래스라고 봐도 될까요?
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
선생님, 여러 머신러닝 모델을 결합하는 다른 방법에 대해 질문있습니다.
안녕하세요 선생님! 지난번에 보내주신 쿠폰은 정말 감사했습니다. 덕분에 다음으로 공부할 것에 대해 계획할 수 있었습니다.개인 공부중에 궁금한 것이 있어 이렇게 여쭤봅니다.제가 사이버보안 분야를 머신러닝으로 향상시키는 것에 관심이 있는데요. 마침 앙상블 수업을 듣던 와중에 개인적으로 공부하고 있던 IDS(침입탐지) 데이터 셋 관련해서 어떤 아이디어가 생겨서요. 이 데이터셋은 다중 분류에 해당되는 것인데요.공격 패턴이 15가지(라벨) 정도라고 가정하겠습니다.이 라벨들을 저만의 방법으로 새로 분류하여 새로운 라벨들을 추가하여 만들어서 각각 학습하고 테스트를 진행해봤습니다. 첫번째로, 이진 분류로 라벨을 0, 1로 다시 만들어서모든 공격들은 1로 분류하고, 일반적인 것(양성,Benign)들은 0으로 분류하는 것이죠.즉, 공격이긴 공격인데 어떤 공격인지는 모르는 정도로만 시스템이 탐지하는 것입니다. 이럴 경우, 정확도, 정밀도, 재현율이 모두 99.97%로 아주 높은 확률로 탐지를 해냅니다. 두번째 분류는 비슷한 공격 패턴끼리 묶어서 그룹화를 한 뒤(즉, 라벨의 수를 줄이는 것입니다.) 학습 및 테스트를 하는 것입니다. 이럴 경우에도 아주 높은 점수를 보였습니다. 마지막 분류는 원래 라벨들입니다(전처리 작업 후). 역시 높은 점수를 보이긴 하나, 약간 낮은 점수를 보이는 일부 라벨들이 있습니다.그래서 말인데요. 혹시 이 세가지 모델을 연결해서 결과를 추출하는 방법이 있을 까요? 예를 들어, 먼저 공격인지 아닌지를 보고(첫번째 분류), 공격이라면 어떤 그룹에 속하는 지 보고(두번 째 분류), A라는 그룹이라면, 마지막 단계의 분류에서 세부적으로 어떤 라벨인지(세번째 분류)를 예측해내는 것이죠. 이렇게 연계하여 결과를 예측할 수 있는 모델을 만든다면, 점수가 약간 낮은 라벨들도 일부 보완할 수 있지 않을 까 생각되어서요.아이디어는 떠올랐는데, 구글에 검색해보니 앙상블이나, 파이프라인 등의 관련된 내용만 검색이 되어서요. 혹시 제가 모르는 어떤 기술이 있을까요? 선생님의 조언을 구합니다.
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
light gbm 버전 관련
밑에 질문하신 분과 같이 light gbm이 3.2.1로만 다운됩니다. pip install lightgbm 명령어를 쳐봤는데도 3.2.1로 됩니다.anaconda는 영상 보고 처음 설치했고, visual studio 2022 빌드 툴도 새로 다운받았습니다. 안돼서 빌드 툴이 아닌 visual studio 2022로도 다운받아봤는데 여전히 3.2.1로만 설치가 됩니다.3.2.1로 이용해도 상관이 없을까요?
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
호텔 고객 수요 예측
안녕하세요.궁금한 점이 있는데 여쭤볼 수 있는 분이 없어서 이렇게 작가님께 질문드려요.저는 프로그래밍에 관심이 있어서 독학을 하고 있는 학생이자, 현재는 부모님께서 운영하시는 호텔일을 도와드리고 있어요.부모님 호텔 일을 도와드리다보니 데이터사이언스라는게 정말 실무에서 유용한 학문이라는 생각이 들더라고요. 그동안은 정성적인 경험에만 의존했다면 이제는 조금도 정량적인 분석 및 기획이 필요한 시기라고 생각을 했어요.그렇게 자연스럽게 작가님의 강의를 접하게 되었고 수강하게되었어요. 호텔 고객 수요 예측을 진행하고 싶은데 이를 위해서는 주로 실무에서 어떤 방법을 사용하고 있을까요?
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
Surprise 실습 관련 Data.load_builtin() 질문입니다.
안녕하세요. 실습 중에 에러가 발생해 해결해보려고 했지만 잘 안돼서 질문 드립니다!data = Dataset.load_builtin('ml-100k') 로 데이터를 로드하려고 하는데 자꾸 에러가 발생합니다.아래는 에러 코드 중 일부를 따온건데, url 에러인 것 같아서 해결하려고 여러번 시도했다가 안돼서 질문 남깁니다. 항상 좋은 강의 감사합니다.Trying to download dataset from https://files.grouplens.org/datasets/movielens/ml-100k.zip...SSLCertVerificationError: [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: certificate has expired (_ssl.c:1129)URLError: <urlopen error [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: certificate has expired (_ssl.c:1129)>
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
공부한 것을 정리해서 블로그같은 곳에 올려도 될까요?
안녕하세요 권철민강사님강사님의 강의와 책의 도움으로 잘 공부하고 있습니다. 다름이 아니라 하루하루 진도 나간 부분을 정리한 것을 블로그 같은 곳에 정리해서 올려도 될까요? 책의 내용과 강의의 내용을 그대로 찍어서 올리는 것이 아니라 노트에 따로 정리한 내용을 중점으로 해보려고 하는데 괜찮으실까요? 먼저 강사님의 허락을 받아야 할 것 같아서 질문남깁니다. 감사합니다.
- 해결됨[개정판] 파이썬 머신러닝 완벽 가이드
분류인데 예측을 회귀로 하는 이유가 궁금해요
로지스틱 회귀 기반으로 타이타닉 생존자에 대한 '분류'를 한다고 하셨는데,회귀와 분류는 엄연히 다른데 이런식으로 혼용해서 쓰이기도 하는지 궁금합니다.
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
MyDummyClassifier 메서드 중 fit 매개변수 중에 y=None으로 설정한 이류
위에서 y의 기본값을 None으로 설정한 이유가 어떻게 되나요? 자세히 알려주시면 감사드리겠습니다.
- 해결됨[개정판] 파이썬 머신러닝 완벽 가이드
.str[:1] 의 정확한 기능이 궁금합니다.
위에서 df['Cabin'].str[:1]의 정확한 기능이 궁금합니다.'cabin' 컬럼의 데이터들 중에 첫번째 글자만 떼어서 다시 저장한거 같은데, str함수의 기능이 문자로 변환해주는 거라고 인터넷에서 봐서요..아래와 같이 질문드립니다.str의 기능, 문자로 바꿔주는게 맞다면 왜 문자로 바꾸는지?[:1]은 단순히 첫번째 글자를 추출하기 위한 인덱싱이 맞는지?첫번째 글자만 추출하기 위해 다른 방법은 없는지 궁금합니다.
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
베이지안 최적화에서 목적 함수 내부 로직 질문입니다.
베이지안 최적화에서는 cross_val_score을 쓰셨고, 산탄데르에서는 Kfold를 쓰셨는데 혹시 이유가 있을까요? 저는 조기 종료 때문에 Kfold를 사용했다고 생각하는데 맞나요? 아니면 데이터의 양 차이 때문인가요? 감사합니다.