월 19,800원
5개월 할부 시다른 수강생들이 자주 물어보는 질문이 궁금하신가요?
- 해결됨[개정판] 파이썬 머신러닝 완벽 가이드
행렬 분해 비용 함수 질문입니다.
안녕하세요! 멋진 강의를 들을 수 있어서 감사하고 있습니다.잠재요인 기반의 협업필터링 이해와 경사하강법을 이용한 행렬 분해 18:12 에서 나오는 L2 규제에 대해 궁금한 점이 있어서 문의 드립니다.수학에 약해서 공부해볼겸 수학적으로 해석을 하려는데, 다른 사이트의 참고 내용들을 보다보니 L2 규제에 시가마가 들어가던데 여기서는 안 들어가는 이유가 무엇인지 궁금합니다.감사합니다!
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
print 구문 안의 {n} 역할
안녕하세요 선생님 먼저 양질의 강의를 제공해주셔서 감사의 말씀 드립니다. 다름 아니라, print 구문 안의 {n} 의 역할이 궁금하여 질문드립니다.K-Fold와 Stratified K-Fold의 이해-02 강의에서 아래와 같은 코드가 있는데, {}안을 다른 숫자로 바꾸면 (1000과 같이 큰 숫자) 에러가 나는데 0,1,2,3 안에서 바꾸면 에러가 발생하지 않더라구요.. accuracy = np.round(accuracy_score(y_test,pred), 4) train_size = X_train.shape[0] test_size = X_test.shape[0] print("\n#{0} 교차 검증 정확도 : {1}, 학습 데이터 크기: {2}, 검증 데이터 크기 : {3}" .format(n_iter, accuracy, train_size, test_size)) print("#{0} 검증 세트 인덱스:{1}".format(n_iter, test_index)) 또한 print 구문 안에 .format(n_iter, accuracy, train_size, test_size))을 사용할 때 . 앞에 list나 dict 같은 table이 없어도 가능한가요? 지금까지는 matrix1.append()이런 식으로만 구현해봐서 저런 표현은 생소하네요..
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
피처 셀렉션에 대해 질문드립니다.
선생님 항상 좋은 강의와 더불어 좋은 답변 해주셔서 감사합니다.피처 셀렉션시 혹시 p-value 로도 피처를 선정하기도 하나요?예를 들어 p-value 값이 0.05보다 큰 경우 피처에서 삭제 한다던지 하는 피처셀렉션도 가능한지 질문드립니다.감사합니다.!
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
추천시스템에서, rating을 한번도 주지 않은 고객
안녕하세요,추천시스템에서, rating을 한번도 주지 않은 고객이 존재할 경우, 이런 고객들은 surprise 패키지를 적용할 수 없는지요?감사합니다.
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
텍스트 분석에서 XGB와 LGBM 성능
Text analytics에서 희소 행렬에 분류를 효과적으로 처리할 수 있는 알고리즘은 로지스틱 회귀, 선형 서포트 벡터 머신, 나이브 베이즈 등이라고 책에 적혀 있는데 텍스트 분석에서 xgboost 와 lightgbm의 성능은 어느정도인가요? 앞에 적은 모델보다는 성능이 떨어지는 경우가 많나요?
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
XGBOOST 파라미터 질문
안녕하세요. 수업 잘 듣고 있습니다 :) Q1XGBoost를 이용한 위스콘신 유방암 예측(파이썬 Native XGBoost 사용) 강의 14분16초 objective 파라미터에 대한 설명을 하는 부분이 있는데요.여기선 0또는 1을 예측하는 것이므로 binary : logistic으로 설정하셨는데 만약 이진 분류가 아닌 라벨값이 0, 1, 2 처럼 2가지를 넘는 경우는 어떻게 설정해야 되나요? Q2사이킷런 래퍼 XGBoost 에선 목적함수 파라미터를 따로 지정한 부분이 없는데 사이킷런 래퍼에선 어떻게 지정해줄 수 있나요?
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
StandardScaler변환 후 log변환
24:04 코드에서 왜곡된 분포 정도를 낮추기 위해 log변환으로 스케일링을 하였는데 StandardScaler로 한번 더 변환을 하는것이 의미가 있는지 궁금합니다 이유가 무엇인가요?
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
2020년판 85p 람다식이 아닌, 함수식으로 하면 에러가 뜨는 이유
선생님 안녕하십니까. 질문이 생겨서 글 남깁니다.2020년판 85p에 있는 내용입니다. 람다식이 아닌, 함수식으로 하면 에러가 뜨는 이유가 궁금해서 질문드립니다.책에서는 람다식으로 정리한건 이해가 됩니다.그래서 함수를 넣어서도 해보고 싶었는데 value error가 뜹니다.제 생각엔 함수에는 x값이 한개씩만 들어가야하는데, titanic_df['Age']를 넣으면 Series로 x가 입력이 되어서 에러가 뜨는 것 같습니다. 이런 경우에는 for문을 돌려서 해결해야하나요? 이상입니다. 늘 좋은 수업 감사합니다. 저번 질문에 대한 답변도 감사합니다 :)
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
스케일링 방식 질문
안녕하세요. 강의 잘 듣고 있습니다 :)평가 실습 - 피마 인디언 당뇨병 예측 15분 58초에서 StandardScaler 를 사용해서 스케일링 작업을하시는데요. 스케일링 방식에는 z-score 변환과min_max 방식이 있는데 각각 어떤 경우에 사용되는 건가요?어떨 때는 z-score 변환으로 스케일링 하는 것이 좋고,어떨 때는 min_max 스케일링 방식이 좋은지 알고 싶습니다. 감사합니다.
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
안녕하세요. 2020년 판 기준 104p에 features.shape[0] 궁금합니다.
선생님 좋은 강의 잘 듣고 있습니다. 매일 즐겁게 수강하고 있습니다.질문이 있어서 글 남깁니다. 2020년 판 기준 104p에 features.shape[0]이 왜 150이 나오는지 궁금합니다.shape 메서드는 이해하고 있어서 [0]이거 없이 실행하면 (150,4)가 나오는 것은 이해가 됩니다. 그런데 [0]을 넣는건 axis =0을 의미하는 건가요?1을 넣으면 4가 나오고 2를 넣으면 error가 떠서 그렇게 추측했는데 맞는지 여쭙고 싶습니다.읽어주셔서 감사합니다 :)
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
안녕하세요. precision_recall_curve()함수 적용할 때 질문드리겠습니다.
강의 내용 중에처음 precision_recall_curve함수 적용하는 부분에서ㅗthresholds의 shape와 precision, recalls의 shape 자체가 본래의 자료보다는 개수가 적어지는데 그 이유가 무엇일까요?? 예를 들어 저희가 이용하였던, y_test의 shape는 원래 (179, ) 였는데 precision_recall_curve를 적용하면 개수가 줄어들더라구요.. 그리고 강의 내용 중에서는 반환된 thresholds나 나머지 것들이 147, 148개의 자료들이 생성되는데.. 저는 코딩을 다시해봐도 165개, 166개가 나오더라구요.. 제가 어떤 부분에서 놓쳤는지 잘 몰라 질문드립니다. 감사합니다.
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
스케일링 1 강의 질문
데이터 전처리 - 스케일링 - 01 강의 1분47초에서표준화로 데이터의 피처 각각이 평균이 0 이고 분산이 1인 가우시안 정규분포로 바꿔준다고 했는데요. 원래 데이터가 정규분포를 가졌다면 xi_new (표준화 식)식 으로 평균이 0 이고 분산이 1인 정규분포를 도출할 수 있지만 애초에 정규분포를 이루지 않는 데이터의 경우는 해당 식을 적용한다고 해서 정규분포가 되지 않을 텐데 이런 경우는 어떻게 해서 정규분포로 만든다는 것일까요? 답변 부탁드립니다. 감사합니다.
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
강의 예시코드
판다스 데이터 인덱싱과 필터링 - 02 강의에서 설명주시는 코드와 강사님의 깃헙 예시코드 내용이 조금씩 다른가요..? 강사님 깃헙에서 실습코드를 다운 받아서 보니 강의에서는 있는데 실습코드에는 없는 경우가 있습니다..
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
feature importance 컬럼명 질문입니다.
안녕하세요 xgboost와 lgbm을 사용하여 학습후 feature importance를 사용하여 중요도를 알아보았는데 몇가지 질문사항이 있습니다.그래프 y축이 컬럼명이 아닌 f21. f0 이런식으로 나오게 되었습니다. 혹시 저게 어떤 데이터를 가리키는지 알수있는 방법이 있나요?2. 컬럼명이 나오게 그래프를 그리려면 pd.Dataframe으로 바꾸면 된다고 했는데 그러면 코드를 처음부터 수정해야하나요? 아니면 from xgboost import plot_importance fig, ax = plt.subplots(figsize=(10, 12)) plot_importance(clf, ax=ax)이 부분에서 수정이 가능할까요?
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
min_samples_leaf에 관한 질문입니다.
결정 트리 주요 하이퍼 파라미터의 이해 강의 중9:21부터 나오는 내용입니다.min_samples_leaf는 노드를 '분할하기 위한' 최소한의 샘플 데이터 수라고 나와있습니다.그런데 강의 내용을 보면 노드가 '분할될 경우의 자식 노드들의 샘플 데이터 수'가 4이상이 안되어 더 이상 분할 할 수 없다고 합니다. 분명 기준은 분할의 대상이 되는 노드의 샘플 데이터 수로 알고 있는데 자식 노드의 샘플 데이터 수도 고려를 해야 하는 것인가요? 정확히 어떤 설명이 맞는 건지 알고싶습니다.
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
파라미터
'max_depth':[1, 2, 3], 'min_samples_split':[2,3] 여기에서 min_samples_split이 왜 2, 3이 되는 지 모르겠습니다. max_depth와 min_samples_split이 무슨 의미이고 어떤 역할을 하는 지 궁금합니다. cv값과 함께 3 * 2 * 3 = 18 회 학습 검증을 수행한다는 것은 이해했습니다.
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
중요피처별 추가 가중치 관련 질문드립니다.
선생님 안녕하세요 강의 잘듣고 있습니다.질문 드리겠습니다. 모델의 피처중에서 정말 중요하다 생각하는 피처가 있어서 이 피처를 모델에서 좀더 영향력을 크게 해주기 위해서 인위적으로 조정해주는 방법이 혹시 있을까요?예를 들면 모델에서 계절 피처가 너무 중요하다 판단되서 다른 피처들보다 더욱더 높은 가중치를 준다던지 이런 방법이 혹시 있을까요??감사합니다.!
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
분류 모델 학습 차원 질문 드립니다.
안녕하세요. 강의 재밌게 수강하고 있습니다. 분류 모델 학습하기 위해서 학습 데이터의 shape를 어떻게 구성하는게 맞는지 질문드립니다.예를 들면, 쇼핑몰에서 고객이 상품을 주문 후 해당 상품이 도착예정일에 도착할 수 있을지 없을지에 대해서 예측 한다라고 할때, 학습 데이터를 어떻게 구성해야 맞는지 고민이 되는데요.아래와 같은 리스트 형태의 데이터가 있다고 하면, 이를 flatten 하게 2차원으로 데이터 프레임으로 구성해야 되는지, 3차원으로 구성해야 하는지가 궁금합니다.memberId: StringorderHistoryList: List<OrderHistory>deliveryInfoList: List<Delivery> 아래와 같이 2차원으로 flatten 하게 구성하게 되면, 고객마다 list 갯수가 다르기 때문에 3차원으로 구성해서 학습하는게 맞지 않나 싶어서 질문 드립니다. 컬럼 : [memberId, OrderHistory1, OrderHistory2.., Deliver1,.., target] 혹시 위와 같은 데이터 세트를 가질때 어떻게 학습하는 방향이 맞는지 답변주실 수 있을가요? 감사합니다.
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
차원축소 fit & transform 관련 질문드립니다!!
안녕하세요 선생님. 개인적인 프로젝트를 진행하며 차원축소나 스케일링시 fit/transform과 관련하여 궁금한 점이 생겨 오랜만에 질문드립니다.선생님께서 쓰신 책의 스케일링 파트에서(131p) 가능하면 스케일링 후 split을 하고 만약 그게 여의치 않다면 학습 데이터로 fit 후 테스트 데이터를 transform 하라고 하셨는데, 여기서 말하신 여의치 않은 상황이 어떤 경우가 있을지 감이 잘 안잡혀 알고 싶습니다. 프로젝트를 하며 전체 데이터에 대하여 차원축소 후 train_test_split 진행할 때와 split 진행 후 차원축소를 train 데이터에 fit하여 진행하였을 때 모델의 정확도 차이가 유의미하게 발생하는데(split 후 차원축소 시 오버 피팅처럼 성능이 나타남), 그 이유는 무엇인지, 둘 중에 높은 성능을 보이는 방향으로 모델을 제작해도 문제가 없는 것인지 궁금합니다.
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
혹시 책 e-book으로 출간하실 계획은 없으신가요?
안녕하세요? 강사님태블릿에 넣어서 출퇴근시간에 짬짬히 볼려고 하는데혹시 계획이 없으신지 궁금합니다