월 19,800원
5개월 할부 시다른 수강생들이 자주 물어보는 질문이 궁금하신가요?
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
min_samples_leaf 질문있습니다.
책 196페이지 마지막줄에 'min_samples_leaf = 4 로 설정하면 샘플이 4 이하이면 리프 노드가 되기 때문에 지니 게수 값이 ~ ' 라는 문장이 잘 이해가 가지 않습니다. min_samples_leaf은 리프 노드가 될 수 있는 샘플 데이터 건수의 최솟값이고 min_samples_leaf 보다 크거나 같은 샘플 값을 지니는 노드만 리프 노드가 될 수 있다고 이해했습니다. 197페이지 그림에도 'Sample이 4 이상인 노드는 리프 클래스 노드가 될 수 있으므로 규칙이 sample 4인 노드를 만들 수 있는 상황을 반영하여 변경됩니다'라고 명시돼있는데 그렇다면 196페이지 마지막줄에 샘플이 4 이하가 아니라 4 이상으로 표기되는 것이 맞는 것이 아닌지, 제가 잘못 이해하고 있는 부분이 있는 것인지 여쭤봅니다! 또, 마찬가지 맥락에서 201페이지에 'min_samples_leaf=6을 설정해 6개 이하의 데이터는 리프 노드를 생성할 수 있도록 리프 노드 생성 규칙을 완화한뒤 ~' 라는 문장이 잘 이해가 가지 않습니다...
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
회귀 강의 관련 내용
p.391 이후의 내용들(회귀트리/stacking 등)에 대한 강의는 따로 없는건가요...? 감사합니다.
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
오타가 있네요.
- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 강의 내용을 질문할 경우 몇분 몇초의 내용에 대한 것인지 반드시 기재 부탁드립니다. - 서로 예의를 지키며 존중하는 문화를 만들어가요. - 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요. 안녕하세요. 강의와 책 잘 보고 있습니다. 2판 170페이지 소스코드에 plt.xlabel("FPR(1-Specificity)") 로 수정이 필요해 보입니다.
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
p.317 gradient decent 질문
안녕하세요. 회귀분석 gradient decent 관련 내용 중 p.317의 마지막 w1, w0를 구할때 w1과 w0의 출력값의 type array 인거 같은데, w1[0,0]과 w0[0,0]에서 [0,0]이 의미하는바가 무엇인지 궁금합니다. 감사합니다.
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
쥬피터랩 오류
주피터랩 실행 시 아래와 같은 오류가 생기는데..원인을 모르겠습니다ㅠ 혹시 알려주실 수 있을까요
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
%matplotlib inline에 대해 질문 남깁니다.
시각화할 때 사용하는 matploblib 라이브러리를 불러온 후, 매번 %matplotlib inline이라는 코드를 작성하셨는데 무슨 기능을 하는지 여쭤보고 싶습니다. 감사합니다.
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
s5의 importance_mean 0.2이라는 것의 의미
안녕하세요 S5 의 importance_mean이 0.2인데, 이것의 의미가 s5를 제거하면 r2가 0.35에서 0.2만큼 감소해 0.15가 된다는 의미일까요
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
회귀 실습 1: 자전거 대여(공유) 수요 예측 -02 수업중 질문있습니다!
제가 기초수준이라 개념이 확실하지 않아 헷갈려서 질문합니다! 13:51초 경에서 LinearRegression 모델로 성능 평가한 뒤, 선생님께서 모델 학습을 했으니 피쳐 중요도를 보겠다고 말씀하시는 부분이 있는데, 그 뒤에 설명해주시는 객체가 coef_ 입니다ㅠ 질문입니다! 1. 피쳐 중요도는 feature_importance_ 이고, 분류모델과 트리계열 Regressor 모델에서만 확인 가능한 객체 아닌가요? 2. coef_(회귀계수)도 피처 중요도라고 이야기할 수 있는건가요? 아니면 회귀 계수를 말씀하시려던게 잠깐 잘못말씀하신건가요? 3. 상관계수와 피쳐 중요도는 어떤 차이가 있는건가요? 추가질문 드립니다. 제가 예전에 공부하면서, 다양한 scaling이나 정규화에 대해서 공부할때 테스트데이터에 대해서는 스케일링을 진행하면 안되고 오직 Train 데이터셋에서만 스케일링을 진행하고 학습해야 된다고 들었었습니다. 그런데 수업에서 모델 예측할때 log1p()된 X_test를 그대로 이용해서 prediction하는 것을 본것 같습니다. 수업에서도 설명해주셨듯, 이후 예측된 값들을 다시 expm1()함수를 이용해서 원상태로 복구만 시켜주면 테스트데이터에 대해서는 스케일링된 데이터를 사용하지 않았다고 생각할 수 있는것인가요? ps. 강의 너무 잘 보고 공부하고있습니다!! 머신러닝 다 공부하고나면 CNN 강의도 결제해서 공부하려합니다 ㅎㅋㅋ!
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
선생님, 질문이 있습니다.
선생님, 안녕하세요.. 다름이 아니라 딥러닝 모델링 관련하여 상담을 좀 요청하고 싶습니다. 이 질문창은 조금 공개적이어서 따로 혹시 이메일이나 줌 등 기회가 된다면 1on1으로 괜찮으시다면 도움을 받고 싶습니다ㅜㅜ 감사합니다.
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
캐글 신용카드 사기 검출 이상치 제거 질문드립니다.
p. 290에서 이상치를 제거하는 함수인 get_outlier()를 정의할 때 Class 값이 1인 것에 대해서만 이상치를 찾아 제거해주는데 그 이유에 대해서 알고 싶습니다. 감사합니다.
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
안녕하세요. 아래 내용 확인 부탁드려요!
안녕하세요. 항상 강의 잘 듣고 있고 감사드립니다. 다름이 아니라 p.237 get_clf_eval() 함수 적용 관련하여 코드가 잘못 나와 있는거 같아, 문의 드립니다. 책은 올해 4월에 나온 개정판 책입니다!
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
Light GBM 로그변환, OHE 변환
안녕하세요. Linear Regression 성능을 위해 로그변환이라든지, OHE 해주잖아요. Light GBM도 로그변환과 OHE 변환의 영향을 받는지요? 감사합니다.
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
min_samples_leaf 관련 질문 드립니다.
안녕하세요 분류 학습 중 이해가 되지 않는 것이 있어 질문을 드립니다. min_samples_leaf는 리프 노드가 되기 위해 필요한 최소한의 샘플 수 라고 알고 있는데요. 시각화 예제를 돌려보던 중 min_samples_leaf= 8로 했을 때 표시한 마지막 리프 노드의 샘플 수가 각각 10, 13인데도 더이상 분할되지 않고 리프 노드가 되었는데 이게 잘 이해가 안 갑니다. 샘플 수가 8이하여야만 리프 노드가 되는 게 아닌가요? 제가 이해를 잘 못하고 있는 건지 헷갈리네요ㅠㅠ 설명 부탁드리겠습니다..!
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
SMOTE 오버샘플링 불러오는데 에러가 납니다
이러한 에러가 나는데요 ㅠ 사이킷런 버전은 아래와 같습니다. 스택오버플로우 찾아보고 고쳐보려 끙끙댔으나 해결하지 못해 여쭤봅니다 ㅜ
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
마지막 셀에서 오류가 납니다.
dt_clf = DecisionTreeClassifier(random_state = 156) skfold = StratifiedKFold(n_splits=3) n_iter = 0 cv_accuracy = [] # StratifiedKFold의 split() 호출시 반드시 레이블 데이터 셋도 추가 입력 필요 for train_index, test_index in skfold.split(features, label): # split()으로 반환된 인덱스를 이용하여 학습용, 검증용 테스트 데이터 추출 X_train, y_train = features[train_index], features[test_index] X_test, y_test = label[train_index], label[test_index] # 학습 및 예측 dt_clf.fit(X_train, y_train) pred = dt_clf.predict(X_test) # 반복 시 마다 정확도 측정 n_iter += 1 accuracy = np.round(accuracy_score(y_test, pred), 4) train_size = X_train.shape[0] test_size = X_test.shape[0] print('\n#{0} 교차 검증 정확도: {1}, 학습 데이터 크기: {2}, 검증 데이터 크기: {3}'. format(n_iter, accuracy, train_size, test_size)) print('#{0} 검증 세트 인덱스:{1}'.format(n_iter, test_index)) cv_accuracy.append(accuracy) # 교차 검증별 정확도 및 평균 정확도 계산 print('\n## 교차 검증별 정확도:', np.round(cv_accuracy, 4)) print('## 평균 검증 정확도:', np.mean(cv_accuracy)) 이런 코드를 작성했더니 dt_clf.fit(X_train, y_train)에서 ValueError: Unknown label type: 'continuous-multioutput'이라는 오류가 납니다. 이런 오류는 왜 발생하는 것이고 어떻게 해결하나요? 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 강의 내용을 질문할 경우 몇분 몇초의 내용에 대한 것인지 반드시 기재 부탁드립니다. - 서로 예의를 지키며 존중하는 문화를 만들어가요. - 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요.
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
인코딩 수행 질문드립니다.
descriptor_df.iloc[:, :-4].head() 1. 위와 같은 데이터에서 첫 번째 컬럼을 인코딩하려고합니다. smiles = descriptor_df[['SMILES']] pd.get_dummies(smiles_df) >>> get_dummies를 이용해서 인코딩을 수행하였습니다. 2. PCA 변환을 수행하기위해 정규화를 진행하려고 했지만 인코딩 오류가 발생했습니다. descriptor_scaled = StandardScaler().fit_transform(descriptor_df.iloc[:, 0:-4]) 제 생각으로는 인코딩을 수행한 값이 원본 데이터 값에 적용이 안 된것 같은데 혹시 어떻게 수정해야 할지 알 수 있을까요?
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
텐서플로우 버전...
안녕하세요, 선생님 다름이 아니라 같은 데이터와 파라미터를 가지고 model.fit() 을 사용했는데, 텐서플로우 v2에서는 Epoch 밑에 숫자가 1304로 나오고 텐서플로우 v1에서는 Epoch 밑에 숫자가 전체 데이터 수인 20862가 나옵니다. 또한 학습 시간도 v1이 훨씬 오래 걸립니다... 구글에 아무리 찾아봐도 궁금증이 풀리지 않아 질문 드립니다. < 설정한 파라미터 > 전체 데이터 수 20,862 Batch_size 16 Epoch 50
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
공분산 행렬이 대각행렬이라고 나와있는 오류와 관련하여
차원 축소 (Dimension Reduction) - PCA(Principal Component Analysis) 영상의 8:00~9:00 부분에 다음과 같은 오류가 있습니다. - 공분산 행렬은 정방행렬(Diagonal Matrix)이며 공분산 행렬은 정방행렬은 맞지만 정방행렬은 영어로 Square Matrix이며 Diagonal Matrix는 대각행렬 (주대각선 성분이 아닌 모든 성분이 0인 정사각 행렬)입니다. 따라서 다음과 같이 정정되어야 할 것 같습니다. - 공분산 행렬은 정방행렬(Square Matrix)이며 좋은 강의 잘 듣고 있습니다. 항상 감사드립니다.
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
평가 질문
안녕하세요. 평가방식에서 Accuracy Recall Precision F1 score ROC-AUC 이 5가지 지표를 설명해주셨는데, 각 모든 지표를 함께 보나요?? 아니면 Accuracy와 F1 score 두개를 본다 또는 Accuracy와 F1 score는 같이 보지 않는다 같은 기준이 따로 있는 걸까요?? accuracy는 데이터가 균형일 때 사용하고 F1 score는 데이터가 불균형일 때 사용한다고 알고 있는데, 그럼 두 지표는 같이 사용하지 않는걸까요?? 같이 사용하는 지표가 있고 같이 사용하지 않는 지표가 있는지 궁금합니다!! 항상 좋은 강의 감사합니다!
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
딕셔너리 관련 질문입니다.
안녕하세요 선생님 강의 매우 잘 수강하고 있습니다. 다름이 아니라 붓꽃데이터들이 딕셔너리 형태로 있다고 말씀하셨습니다. 그래서 .keys()를 통해 키값을 얻었고 이 때, key인 'data'의 value 값을 얻어내려면 iris_data['data'] 가 되어야하는것 아닌가요? 어떤 이유에서 여기서는 iris_data.data 가 허용되는지 궁금합니다. 제가 초보라서 자세히 답변주시면 정말 감사드리겠습니다. 감사합니다!