월 19,800원
5개월 할부 시다른 수강생들이 자주 물어보는 질문이 궁금하신가요?
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
코드에서 default값 보기
선생님 강의에서 코드의 default값을 종종 보시는데 어떻게 보는지 모르겠습니다 ㅠㅠ 마우스로 클릭하고 어떻게해야 default값을 볼수있나요??? 강의와 관련있는 질문을 남겨주세요.• 강의와 관련이 없는 질문은 지식공유자가 답변하지 않을 수 있습니다. (사적 상담, 컨설팅, 과제 풀이 등)• 질문을 남기기 전, 비슷한 내용을 질문한 수강생이 있는지 먼저 검색을 해주세요. (중복 질문을 자제해주세요.)• 서비스 운영 관련 질문은 인프런 우측 하단 ‘문의하기’를 이용해주세요. (영상 재생 문제, 사이트 버그, 강의 환불 등) 질문 전달에도 요령이 필요합니다.• 지식공유자가 질문을 좀 더 쉽게 확인할 수 있게 도와주세요.• 강의실 페이지(/lecture) 에서 '질문하기'를 이용해주시면 질문과 연관된 수업 영상 제목이 함께 등록됩니다.• 강의 대시보드에서 질문을 남길 경우, 관련 섹션 및 수업 제목을 기재해주세요. • 수업 특정 구간에 대한 질문은 꼭 영상 타임코드를 남겨주세요! 구체적인 질문일수록 명확한 답을 받을 수 있어요.• 질문 제목은 핵심 키워드를 포함해 간결하게 적어주세요.• 질문 내용은 자세하게 적어주시되, 지식공유자가 답변할 수 있도록 구체적으로 남겨주세요.• 정확한 질문 내용과 함께 코드를 적어주시거나, 캡쳐 이미지를 첨부하면 더욱 좋습니다. 기본적인 예의를 지켜주세요.• 정중한 의견 및 문의 제시, 감사 인사 등의 커뮤니케이션은 더 나은 강의를 위한 기틀이 됩니다. • 질문이 있을 때에는 강의를 만든 지식공유자에 대한 기본적인 예의를 꼭 지켜주세요. • 반말, 욕설, 과격한 표현 등 지식공유자를 불쾌하게 할 수 있는 내용은 스팸 처리 등 제재를 가할 수 있습니다.
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
주니터노트북 커널죽음
LightGBM을 실행시키면 계속 커널이 죽는다고 뜨는데 해결방법을 모르겠습니다ㅠㅠㅠ 맥북이용자입니다ㅠㅠ
- 해결됨[개정판] 파이썬 머신러닝 완벽 가이드
이상치 제거 관련 질문
안녕하세요 강사님, 캐글 산탄데르 고객 만족 예측 문제에서 질문이 생겨 여쭙습니다. 이상치를 제거하는 함수를 만들어서 적용해보았는데 7만개 데이터 중 1만8천개 정도만 남고 나머지는 제거되어, 이대로 모델을 학습 및 예측하니 여러 평가지표에서 매우 높게(정확도:0.9922, 정밀도:1, 재현율:0.8682, AUC:0.9833) 측정이 됐는데 과적합이라고 봐야할까요? 이상치를 제거할 때, 어느정도까지 데이터를 제거하면 좋을까요? 그리고 lightgbm 이나 xgboost의 feature_importances_ 가 높은 피처를 기준으로 이상치를 제거해보기도 했는데 이 방법도 괜찮을까요? 신용카드 사기 검출 예측 파트에서는 상관관계에 따라 피처를 골라 이상치를 제거했는데 중요도가 높은 피처를 기준으로 이상치를 제거해도 효과가 있는지 궁금합니다!
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
rand, randn
rand와 randn의 기능적 차이가 무엇이 있나요?
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
kfold 와 cross_val_score()
교차검증(kfold) 진행시에 cross_val_score()을 못쓰고 반드시 def로 함수를 만들어 kfold 식을 써야하는 경우도 있나요?? 두개방식의 코드줄수의 차이가 많이나서 궁금해서 질문드립니다. 또한 모든 estimator에서 보통 하이퍼파라미터 튜닝을 진행하는지도 궁금합니다 마지막으로 분류문제에서 cross_val_score() 을 사용하면 자동으로 Stratified Kfold로 진행되는건가요? 강의와 관련있는 질문을 남겨주세요.• 강의와 관련이 없는 질문은 지식공유자가 답변하지 않을 수 있습니다. (사적 상담, 컨설팅, 과제 풀이 등)• 질문을 남기기 전, 비슷한 내용을 질문한 수강생이 있는지 먼저 검색을 해주세요. (중복 질문을 자제해주세요.)• 서비스 운영 관련 질문은 인프런 우측 하단 ‘문의하기’를 이용해주세요. (영상 재생 문제, 사이트 버그, 강의 환불 등) 질문 전달에도 요령이 필요합니다.• 지식공유자가 질문을 좀 더 쉽게 확인할 수 있게 도와주세요.• 강의실 페이지(/lecture) 에서 '질문하기'를 이용해주시면 질문과 연관된 수업 영상 제목이 함께 등록됩니다.• 강의 대시보드에서 질문을 남길 경우, 관련 섹션 및 수업 제목을 기재해주세요. • 수업 특정 구간에 대한 질문은 꼭 영상 타임코드를 남겨주세요! 구체적인 질문일수록 명확한 답을 받을 수 있어요.• 질문 제목은 핵심 키워드를 포함해 간결하게 적어주세요.• 질문 내용은 자세하게 적어주시되, 지식공유자가 답변할 수 있도록 구체적으로 남겨주세요.• 정확한 질문 내용과 함께 코드를 적어주시거나, 캡쳐 이미지를 첨부하면 더욱 좋습니다. 기본적인 예의를 지켜주세요.• 정중한 의견 및 문의 제시, 감사 인사 등의 커뮤니케이션은 더 나은 강의를 위한 기틀이 됩니다. • 질문이 있을 때에는 강의를 만든 지식공유자에 대한 기본적인 예의를 꼭 지켜주세요. • 반말, 욕설, 과격한 표현 등 지식공유자를 불쾌하게 할 수 있는 내용은 스팸 처리 등 제재를 가할 수 있습니다.
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
ix 오류
ix 필터링은 계속오류가 뜨는데 이제 사용못하는건가요??? loc, iloc만 사용해야하는것인지 궁금합니다 강의와 관련있는 질문을 남겨주세요. • 강의와 관련이 없는 질문은 지식공유자가 답변하지 않을 수 있습니다. (사적 상담, 컨설팅, 과제 풀이 등)• 질문을 남기기 전, 비슷한 내용을 질문한 수강생이 있는지 먼저 검색을 해주세요. (중복 질문을 자제해주세요.)• 서비스 운영 관련 질문은 인프런 우측 하단 ‘문의하기’를 이용해주세요. (영상 재생 문제, 사이트 버그, 강의 환불 등) 질문 전달에도 요령이 필요합니다.• 지식공유자가 질문을 좀 더 쉽게 확인할 수 있게 도와주세요.• 강의실 페이지(/lecture) 에서 '질문하기'를 이용해주시면 질문과 연관된 수업 영상 제목이 함께 등록됩니다.• 강의 대시보드에서 질문을 남길 경우, 관련 섹션 및 수업 제목을 기재해주세요. • 수업 특정 구간에 대한 질문은 꼭 영상 타임코드를 남겨주세요! 구체적인 질문일수록 명확한 답을 받을 수 있어요.• 질문 제목은 핵심 키워드를 포함해 간결하게 적어주세요.• 질문 내용은 자세하게 적어주시되, 지식공유자가 답변할 수 있도록 구체적으로 남겨주세요.• 정확한 질문 내용과 함께 코드를 적어주시거나, 캡쳐 이미지를 첨부하면 더욱 좋습니다. 기본적인 예의를 지켜주세요.• 정중한 의견 및 문의 제시, 감사 인사 등의 커뮤니케이션은 더 나은 강의를 위한 기틀이 됩니다. • 질문이 있을 때에는 강의를 만든 지식공유자에 대한 기본적인 예의를 꼭 지켜주세요. • 반말, 욕설, 과격한 표현 등 지식공유자를 불쾌하게 할 수 있는 내용은 스팸 처리 등 제재를 가할 수 있습니다.
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
레이블 인코딩 질문이 있습니다
items = ['TV','냉장고','전자렌지','컴퓨터','선풍기','믹서']을 레이블 인코딩을 하면 [0, 1, 4, 5, 3, 2]로 숫자를 배정하는데 이 숫자는 해당 feature 수만큼 랜덤으로 배정한건가요? 아니면 다른 규칙이 있나요?
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
이상치 데이터 제거 후 모델 학습/예측/평가
마지막 로지스틱 회귀 예측 성능과, lightgbm 예측 성능 나타내는 로직에서 똑같이 했는데 자꾸 에러가 나네요
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
coo와 csr의 결과가 똑같은데..
선생님~ 강의 7:53에서 나오는 코드에서 coo와 csr을 출력해보면.. 결과가 똑같이 나오는데.. 희소행렬의 저장변환형식의 과정만 서로 다른건가요..?
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
질문드립니다.
현재 ROC AUC 부분에서 막혀서 인강을 다시 보고 책을 다시 보고 있으니, 본인이 어디서 막히는 지 감이 안잡혀서,,,다음 단원으로 넘어가서 2회독일때 다시 확인을 해봐야는지, 아니면 끝까지 해결하고 가야하는지 기준이 안서서 질문드립니다 감사합니 :)
- 해결됨[개정판] 파이썬 머신러닝 완벽 가이드
XGBoost 관련 질문입니다
안녕하세요 강사님, XGBoost관련 질문이 몇가지 생겨 여쭤봅니다! 1. 답변해주신 질문 중, early_stoppings와 early_stopping_rounds의 차이가 없다고 하셨는데, 파이썬 래퍼 xgboost에서 실행을 해보면 early_stopping 파라미터만 설정한 경우 조기중단이 수행이 안되고, early_stopping_rounds를 설정해야만 조기중단이 수행되는데 이 부분이 잘 이해되지 않습니다. 2. xbg.train()에서 evals라는 파라미터에 wlist를 할당하는데 wlist=[(dtrain,'train'),(dtest,'eval')] 입니다. 이 부분에서 evals는 성능평가 데이터셋을 받는 파라미터인데 훈련데이터를 넣어도 되는지 궁금합니다. 3. Tree pruning 기능이 장점으로 적혀있는데 어떤 파라미터에 의한 기능인지, 아니면 xgboost를 실행하기만 하면 자동적으로 실행되는 시스템적인 장점인지 모르겠습니다..! 4. 교차검증과 결손값이 자체처리된다고 하셨는데 교차검증은 cv() API로 처리되는 것이고, 결손값 자체처리는 데이터 전처리가 필요하지 않다는 이야기로 이해했는데 맞을까요..? 5. XGBoost나 LightGBM을 약한 학습기로 다시 배깅이나 보팅을 하는 것이 가능하지만 수행시간이 너무 오래 걸려 잘 사용되지 않는 것인지 궁금합니다! 6. 책에서 p.231에서는 파라미터명이 num_boost_rounds인데 뒤에서 train()의 파라미터는 num_boost_round인데 어떤 것이 맞는건가요? 둘다 맞다면 num_boost_rounds는 어디서 쓰이는 것인지 궁금합니다. 질문이 많은데 미리 죄송합니다..! 구글링해봐도 원하는 답이 잘안나와서 여쭙습니다! 항상 감사합니다
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
랜덤포레트스 피쳐 관련 질문입니다.
선생님 안녕하세요. 랜덤포레스트나 앙상블 기법 관련해서 질문드립니다. 예제데이터의 경우 , 피쳐의 속성이 연속형 변수로 동일하던데 만약에, 피쳐가 연속, 이산, 이분형 변수여도 랜덤포레트스 등의 기법을 사용할 수 있는지 궁금합니다. 예) 컬럼1 : 연속형 / 컬럼2 : 바이너리 / 컬럼3: 이산형 변수 또한 변수의 종류에 상관없다면, 성능 개선을 위해서 피쳐의 데이터 속성을 통일시켜야 하는지도 궁금합니다. 감사합니다.
- 해결됨[개정판] 파이썬 머신러닝 완벽 가이드
GridSearchCV 결과가 강의 내용과는 다른 결과가 나옵니다.
12:34 분쯤에서 max_depth의 값을 여러 개를 이용하여 최적의 max_depth값을 찾는 내용이 있는데, 강의상에서는 평균 정확도 수치가 0.8526, 그리고 최적의 max_depth값은 8이 나오고 있습니다. 하지만 제 환경에서 돌릴때는 평균 정확도 수치가 0.8513이 나오고 최적의 max_depth값은 16이 나오고 있습니다. 코드는 github에 올라온 코드를 그대로 복사 붙여넣기를 해보기도 해서 코드 상의 차이점은 없어 보입니다. 혹시 scikit-learn의 버전 차이때문에 이런 일이 발생할 수 있는지요? 제 현재 scikit-learn 버전은 0.23.1입니다.
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
파라미터 최적화(W0,W1) 질문입니다.
다음 코드에서 W1과 W0에 대해 최적해를 도출하는 코드는 없다고 생각되어 질문드립니다.이 함수의 결과값은 단지 반복 횟수 마지막의 W1,W0 인지 궁금합니다. 감사합니다.
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
인코딩 질문
레이블 인코딩, 원핫인코딩과 pd.get_dummies의 차이가 무엇인가요? 결과가 동일하면 pd.get_dummies를 쓰는 것이 더 편하지 않나요? 감사합니다
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
코드 오류
안녕하세요! 생존자 예측할때 여러 classifier를 사용하고 학습, 예측, 평가 과정에서 다음과 같은 오류가 발생했습니다. 코드는 선생님이 적어주신 대로 확인하였는데, 무엇이 문제인지 알고 싶습니다. 오류의 윗부부는 다음과 같습니다. 추가로, randomforest 평가 수치가 선생님께서 보여주신 수치와 다른데, 이것도 코드의 문제인가요? DecisionTreeClassifier 정확도: 0.7877 RandomForestClassifier 정확도: 0.8547 --------------------------------------------------------------------------- AttributeError Traceback (most recent call last) <ipython-input-32-a717530aaf63> in <module> 20 21 # LogisticRegression 학습/예측/평가 ---> 22 lr_clf.fit(X_train, y_train) 23 lr_pred = lr_clf.predict(X_test) 24 print('LogisticRegression 정확도: {0:.4f}'.format(accuracy_score(y_test, lr_pred)))
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
스케일링과 로그변환의 차이
선생님~ 선형회귀에서 학습/예측하기 전에 타겟값이 정규분포형태를 띄지 않을 경우, 정규분포로 만들어 주기 위해 '로그변환'을 해주었잖아요~ PCA에서는 정규분포로 만들어주기 위해 PCA를 적용할 피처들을 모두 StandardScaler를 해주는데.. 공부하면서 궁금한 점이.. 로그변환과 스케일링이 방식이 조금은 차이가 나지만 둘다 사용의도가 데이터 값들 간의 간극을 좁히고 정규분포 형태로 만들어주는 의미인 것 같아서..사용법에 대해서 확연한 차이가 느껴지지 않는데.. 어떨 때 로그변환을 쓰고 어떨 때 스케일링을 쓰는 것이 좋은 것인지 ...궁금해지네요.. 정해진 게 아닌 것 같긴한데.. 그냥 아무 상관이 없는 건지.. 궁금해서 질문드립니다..! 추가적으로, 통계분석에서는 정규성검정(kolmogo-rov)같은 기능이 머신러닝에서는 있는지 궁금합니다. (선형회귀에서 타겟값의 정규 분포를 확인할 때 distplot 으로 정규분포형태인지 아닌지 확인하는 정도 인 것 같아서요..)
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
LinearRegression CV 평균 RMSE값
선생님 강의 19:39 쯔음에 강의에서는LinearRegression CV 평균RMSE값이 0.155 나오는데.. 직접 코드 실행해보니, LinearRegression CV 평균 RMSE값이 4223.92 로 너무 많이 차이가 나서요.. 왜그러는 걸까요..? 다른 Ridge나, Lasso의 평균 RMSE 값은 동일하게 나왔는데.. (버전이 다른 것도 있긴 하겠지만 너무 많이 차이가 나서 ..)
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
titanic 생존자 예측 중 에러
타이타닉 생존자 예측 부분 레이블 인코딩 부분에서 에러가 발생하는데 코드는 똑같은거 같은데 이유를 잘 모르겠습니다.. from sklearn import preprocessing def encode_features(dataDF): features = ['Cabin', 'Sex', 'Embarked'] for feature in features: le = preprocessing.LabelEncoder() le = le.fit(dataDF[feature]) dataDF[feature] = le.transform(dataDF[feature]) return dataDF titanic_df = encode_features(titanic_df) titanic_df.head()
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
안녕하세요. 이 강의 질문란을 통해 컴퓨터비젼 강의에 대해 여쭙고자 합니다.
안녕하세요. 집필하신 책 정말 큰 도움되었습니다. 그래서 다름이 아니라 컴퓨터비젼에 대한 호기심도 생겨서 여쭙고자 합니다. (인프런에서는 강의에 대해 먼저 물어볼 수 있는 기능이 없어서 이렇게 여쭤보게 됩니다...) 텐서플로우 1.xx 버젼을 사용하는지 2.xx 버젼을 사용하는지 궁금합니다!!