월 19,800원
5개월 할부 시다른 수강생들이 자주 물어보는 질문이 궁금하신가요?
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
Xgboost에서 피처중요도 관련
피처 중요그래프에서 그래프바 오른쪽에 표시된 숫자가 의미하는 것은 무엇이고 피처와 관련해서 어떻게 해석할 수 있나요? 그리고 피처 중요도를 100% 기준으로 피처 중요도를 계산할 수 있는지 궁금합니다.
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
경사하강법 관련 질문
안녕하세요 강사님, 경사하강법 부분 코드를 보면 w값은 0으로 지정한 후에 편미분값을 점진적으로 빼면서 업데이트를 수행한다고 나와있습니다. 여기서 w값을 0으로 설정하는 부분에서 의문점이 생깁니다. 만약 비용이 최소가 되는 임계점보다 0이 작을 경우, 편미분값을 지속적으로 뺐을 때, 경사하강법의 방향성이 맞는지 궁금합니다. 0에서 편미분값을 빼면서 출발했는데 경사가 내리막길이 아닌 오르막길일 경우가 있지 않은가에 대한 궁금증입니다.
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
LogisticRegression 에 대해서
안녕하세요 오차행렬을 구하는 코드에서 LogisticRegression을 이용하는 이유가 궁금합니다. LogisticRegression이 Estimator에 해당하는지, Estimator라면 생존자 분류모델에서 Classifier가 아닌 Regression을 쓰는 이유가 무엇인지 궁금합니다?
- 해결됨[개정판] 파이썬 머신러닝 완벽 가이드
규제 선형 모델에 관련해서 질문드립니다.
안녕하세요. 규제 선형 모델에 관련해서 궁금한 점이 있어 질문드립니다. 1. degree=15의 다항 회귀를 하면 feature 수가 기하급수적으로 늘어나 Over-fitting 되는 점은 이해가 됩니다. 그러나 5장의 '규제 선형 회귀 개요' 파트에 하신 설명을 보면 "앞의 예제에서 Degree=15의 다항 회귀는 지나치게 모든 데이터에 적합한 회귀식을 만들기 위해서 다항식이 복잡해지고 회귀 계수가 매우 크게 설정이 되면서 과대 적합이 되고 평가 데이터 세트에 대해서 형펀 없는 예측 성능을 보였습니다." -> 여기서 다항식이 복잡해지고 '회귀 계수가 매우 크게 설정'이 되면서 과대 적합이 됐다고 하셨는데 과대 적합과 회귀 계수가 큰 것과의 연관성에 대해서 잘 이해가 되지 않아 질문드립니다. 2. 바로 다음 장인 '규제 선형 모델에서 alpha의 역할' 에서 비용 함수 (RSS(W) + alpha*W^2)을 최소화하는 것이 목표라고 나옵니다. 여기서 alpha 값이 증가한다면 회귀 계수 w를 감소시켜 비용 함수 값을 낮추고 alpha 값이 감소하면 RSS(W) 값이 최소화 된다고 하셨는데 비용 함수를 최소화 하기 위해 만약, alpha 값이 크다면 회귀 계수 w 값을 감소시켜야 한다는 것 까지는 알겠습니다. 그러나 alpha 값이 감소하면 RSS(W) 값이 최소화 된다는게 어떻게 이루어지는지 잘 모르겠습니다. 단순히 alpha 값이 작으면 alpha*W^2 값도 덩달아 작아질 것이고 그 값이 무시해도될 작은 값이라 RSS(W) 값 변동도 소량이어서 최소화라고 표현하신건지 잘 모르겠습니다.
- 해결됨[개정판] 파이썬 머신러닝 완벽 가이드
안녕하세요.
안녕하세요. 5장의 경사 하강법 파트를 진행하고 있는 수강생 입니다. 다름이 아니오라 경사 하강법과 역전파의 명확한 차이점을 알고 싶어서 질문드립니다. 제가 직관적으로 이해하기에 경사 하강법과 역전파의 큰 틀은 동일하다고 생각됩니다. 경사 하강법의 경우, 머신러닝 선형 회귀 경우에 RSS 편미분 값을 가지고 반복적인 계산을 통해 회귀 계수 w 파라미터 값을 업데이트하면서 cost 값이 최소가 되는 w 파라미터를 구하는 방식입니다. 역전파의 경우도 딥러닝 신경망에서 loss의 편미분 값을 역전파하면서 weight & bias 값을 지속적으로 업데이트하고 loss 값이 최소가 되는 weight & bias 파라미터 값을 찾는 걸로 알고있습니다. 결국, 오차 편미분 값을 사용하여 파라미터 값을 지속적으로 업데이트하면서 오차값이 최소가 되는 파라미터를 찾는 목적은 동일합니다. 그러면 두 방식의 큰 차이점은 적용 대상이 다르다는 점 일까요 ? 경사 하강법은 주로 머신 러닝의 알고리즘에 반면 역전파는 딥러닝의 신경망 한정해서 강의 내용과 크게 연관성이 없어보이지만 문득 든 생각에 궁금증을 해소할 길이 없어 이렇게 질문 남깁니다. 감사합니다.
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
안녕하십니까 선생님
다항 회귀에 와서 약간 어려움을 겪고있어서 처음 질문을 드립니다. 단일회귀가 선으로 회귀면, 다중 회귀는 평면으로 이해했습니다. 1. 피쳐가 한개인 데이터가 비선형적으로 나온 경우 polynomialFeatures를 통해 피쳐를 임의로 늘려준다고 배웠습니다. 그렇다면 다항회귀도 결국 피쳐가 늘어난 다중회귀라고 생각되는데, 그럼 degree를 엄청 높이면 공간상에 저희가 알수 없는 고차원의 것으로 회귀된다고 보면 되나요? 2. 다항회귀를 통해 회귀된 고차원의 것이 있다면, 그것을 x1 피쳐 단면에 의해서만 보이게 짤랐기 때문에 아래 사진처럼 2차원으로 관찰 할수 있다고 보면 될까요?
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
회귀계수가 0인 변수 제거 후 평가 결과 관련해서 질문드립니다
안녕하세요. 학습과 테스트 데이터 셋으로 분리하고 학습/예측/평가를 수행 후에 회귀계수를 내림차순으로 정렬하였습니다. 회귀계수가 0인 변수를 제거하고 다시 학습/예측/평가한 결과, MES,RSME,VARIANCE가 기존보다 낮아졌습니다. 회귀계수0인 변수들은 Y값에 어떠한 영향도 주지 않는다고 생각하여 제거하여도 동일한 값이 나올것이라 예상하였습니다. 어떠한 원인때문에 이런 결과 도출되는지 가르쳐주시면 감사하겠습니다. (참고로 기존에 학습,테스팅으로 나눈 X_train,X_test에서 회귀계수가 0인 ZN,INDUS,AGE,TAX,B 변수를 제거하였습니다.)
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
강의 ppt 슬라이드
혹시 강의 ppt 슬라이드는 어디서 다운받을수 있을까요?
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
캐글 강의 관련
안녕하세요, 딥러닝에 이어 머신러닝도 수강중입니다. 좋은 강의 진심으로 감사드립니다. 일단 완강을 목표로 학습중인데 릴리즈하신 캐글강의를 무리없이 소화하려면 이 강의는 일단 어디까지 들으면 될까요? 답변부탁드립니다.
- [개정판] 파이썬 머신러닝 완벽 가이드
네이버 영화 평점 감성 분석 GridSearch 관련
삭제된 글입니다
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
선형회귀모델을 위한 데이터변환
타깃값의 경우 일반적으로 로그변환을 적용한다고 설명해주셨는데 positive skew, negative skew 인 두가지 모두의 경우 즉 분포의 왼쪽,오른쪽 쏠림 모든경우에 log변환을 하면되는건가요? 두경우다 쏠린값을 log값이 해결해주는것인지 궁금합니다. + feature값도 동일한 원리인지 궁금합니다 강의와 관련있는 질문을 남겨주세요.• 강의와 관련이 없는 질문은 지식공유자가 답변하지 않을 수 있습니다. (사적 상담, 컨설팅, 과제 풀이 등)• 질문을 남기기 전, 비슷한 내용을 질문한 수강생이 있는지 먼저 검색을 해주세요. (중복 질문을 자제해주세요.)• 서비스 운영 관련 질문은 인프런 우측 하단 ‘문의하기’를 이용해주세요. (영상 재생 문제, 사이트 버그, 강의 환불 등) 질문 전달에도 요령이 필요합니다.• 지식공유자가 질문을 좀 더 쉽게 확인할 수 있게 도와주세요.• 강의실 페이지(/lecture) 에서 '질문하기'를 이용해주시면 질문과 연관된 수업 영상 제목이 함께 등록됩니다.• 강의 대시보드에서 질문을 남길 경우, 관련 섹션 및 수업 제목을 기재해주세요. • 수업 특정 구간에 대한 질문은 꼭 영상 타임코드를 남겨주세요! 구체적인 질문일수록 명확한 답을 받을 수 있어요.• 질문 제목은 핵심 키워드를 포함해 간결하게 적어주세요.• 질문 내용은 자세하게 적어주시되, 지식공유자가 답변할 수 있도록 구체적으로 남겨주세요.• 정확한 질문 내용과 함께 코드를 적어주시거나, 캡쳐 이미지를 첨부하면 더욱 좋습니다. 기본적인 예의를 지켜주세요.• 정중한 의견 및 문의 제시, 감사 인사 등의 커뮤니케이션은 더 나은 강의를 위한 기틀이 됩니다. • 질문이 있을 때에는 강의를 만든 지식공유자에 대한 기본적인 예의를 꼭 지켜주세요. • 반말, 욕설, 과격한 표현 등 지식공유자를 불쾌하게 할 수 있는 내용은 스팸 처리 등 제재를 가할 수 있습니다.
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
kfold 질문
강의와 관련있는 질문을 남겨주세요.• 강의와 관련이 없는 질문은 지식공유자가 답변하지 않을 수 있습니다. (사적 상담, 컨설팅, 과제 풀이 등)• 질문을 남기기 전, 비슷한 내용을 질문한 수강생이 있는지 먼저 검색을 해주세요. (중복 질문을 자제해주세요.)• 서비스 운영 관련 질문은 인프런 우측 하단 ‘문의하기’를 이용해주세요. (영상 재생 문제, 사이트 버그, 강의 환불 등) 질문 전달에도 요령이 필요합니다.• 지식공유자가 질문을 좀 더 쉽게 확인할 수 있게 도와주세요.• 강의실 페이지(/lecture) 에서 '질문하기'를 이용해주시면 질문과 연관된 수업 영상 제목이 함께 등록됩니다.• 강의 대시보드에서 질문을 남길 경우, 관련 섹션 및 수업 제목을 기재해주세요. • 수업 특정 구간에 대한 질문은 꼭 영상 타임코드를 남겨주세요! 구체적인 질문일수록 명확한 답을 받을 수 있어요.• 질문 제목은 핵심 키워드를 포함해 간결하게 적어주세요.• 질문 내용은 자세하게 적어주시되, 지식공유자가 답변할 수 있도록 구체적으로 남겨주세요.• 정확한 질문 내용과 함께 코드를 적어주시거나, 캡쳐 이미지를 첨부하면 더욱 좋습니다. 기본적인 예의를 지켜주세요.• 정중한 의견 및 문의 제시, 감사 인사 등의 커뮤니케이션은 더 나은 강의를 위한 기틀이 됩니다. • 질문이 있을 때에는 강의를 만든 지식공유자에 대한 기본적인 예의를 꼭 지켜주세요. • 반말, 욕설, 과격한 표현 등 지식공유자를 불쾌하게 할 수 있는 내용은 스팸 처리 등 제재를 가할 수 있습니다. kfold 교차검증 수행에 관한 질문을 드립니다. 타이타닉 예제 강의 코드중 일부입니다 # KFold 교차 검증 수행 for iter_count, (train_index, test_index) \ in enumerate(kfold.split(X_titanic_df)): 이부분이 잘 이해가 되지 않습니다 괄호부분 (train_index, test_index) 에 어떻게 데이터가 분배되서 들어가는지 잘 모르겠습니다달에도 요령이 필요합니다. • 지식공유자가 질문을 좀 더 쉽게 확인할 수 있게 도와주세요. • 강의실 페이지(/lecture) 에서 '질문하기'를 이용해주시면 질문과 연관된 수업 영상 제목이 함께 등록됩니다. • 강의 대시보드에서 질문을 남길 경우, 관련 섹션 및 수업 제목을 기재해주세요. • 수업 특정 구간에 대한 질문은 꼭 영상 타임코드를 남겨주세요! 구체적인 질문일수록 명확한 답을 받을 수 있어요. • 질문 제목은 핵심 키워드를 포함해 간결하게 적어주세요. • 질문 내용은 자세하게 적어주시되, 지식공유자가 답변할 수 있도록 구체적으로 남겨주세요. • 정확한 질문 내용과 함께 코드를 적어주시거나, 캡쳐 이미지를 첨부하면 더욱 좋습니다. 기본적인 예의를 지켜주세요. • 정중한 의견 및 문의 제시, 감사 인사 등의 커뮤니케이션은 더 나은 강의를 위한 기틀이 됩니다. • 질문이 있을 때에는 강의를 만든 지식공유자에 대한 기본적인 예의를 꼭 지켜주세요. • 반말, 욕설, 과격한 표현 등 지식공유자를 불쾌하게 할 수 있는 내용은 스팸 처리 등 제재를 가할 수 있습니다. kfold 교차검증 수행에 관한 질문을 드립니다. 타이타닉 예제 강의 코드중 일부입니다 # KFold 교차 검증 수행 for iter_count, (train_index, test_index) \ in enumerate(kfold.split(X_titanic_df)): 이부분이 잘 이해가 되지 않습니다 괄호부분 (train_index, test_index) 에 어떻게 데이터가 분배되서 들어가는지 잘 모르겠습니다
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
6. 넘파이 배열 ndarray 소개의 axis
-ndarray는 행열의 개념이 아니라 axis0(행방향), axis1(열방향)의 개념을 갖는다. ?) 여기서 강사님께서 "1차원 배열은 axis 1만 있겠죠~"라고 말씀하였는데 강의자료는 axis0으로 되어 있어 어느 것이 맞는 것인지 궁금하여 질문드립니다. axis 1인데 강의 자료의 오류인지, 아니면 axis 0, 1, 2..순으로 ndarray에서 부여되는 것이어서 강의자료 대로 표시된 것이 맞는 것인지 궁금합니다.
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
이해가 잘 안되서 질문드려요 ㅠ
선생님~강의에서 첫번째 실습으로 하는 (강의 1:13부터 시작하는 내용) '1 경사하강을 이용한 행렬 분해 ' 내용에서 결과(11:50)기존 R의 행렬과 예측행렬 pred_matrix 를 보면, 이렇게 결과가 나오는데요..노란색 친 부분이 기존에 nan값이었던 부분인데요..이 값들은 의미있게 예측이 된 것이 맞나요..? (강의 8:10부터 내용) 이 내용을 보면 기존 R에서 nan 값의 위치하는 원소들은 제외하고, 경사하강법을 통해 P와 Q의 원소들을 업데이트 하는데..그러면 nan 값의 위치하는 원소들의 값은 경사하강이 되는게 맞는건지요..? 강의 (11:50~54)에서도 선생님께서 '최대한 값이 있는 것에 대해서는 실제값과 유사하게 근사되었음을 확인하실 수 있습니다. ' 라고 말씀하셨는데요..그래서 nan값이 값들에 대한 예측은 의미없는거로 이해가 되었는데요.. 그 이후, 두번째 실습인 영화평점 실습에서도 위와 같은 방식으로 예측행렬을 구하는데.. 기존에 사용자가 영화를 보지 않은 평점은, 첫번째 실습에서의 nan값과 같은 거 아닌가요..?그렇다면.. 예측행렬에서 nan값 위치들의 예측값들이 의미가 있는건지..즉 사용자가 관람하지 않은 영화에 대한 평점예측값이 이 방식에서는 의미가 있는 건지..의문이 듭니다.. 제가 이해가 잘 안되네요..ㅜ
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
정밀도 부분에서 값이 재현율과 정확도 부분에 비해 현저히 낮게나옵니다.
문제는 없는걸로 알고있지만 왜 그런지에대하여 궁금하여 질문드립니다. import pandas as pd from sklearn.model_selection import train_test_split from sklearn.linear_model import LogisticRegression # 원본 데이터를 재로딩, 데이터가공, 학습 데이터/ 테스트 데이터 분할 titanic_df = pd.read_csv('titanic_train.csv') y_titanic_df = titanic_df['Survived'] X_titanic_df = titanic_df.drop('Survived',axis=1) X_titanic_df = transform_features(X_titanic_df) X_train, X_test, y_train, y_test = train_test_split(X_titanic_df, y_titanic_df, test_size = 0.20 , random_state=11) lr_clf = LogisticRegression(max_iter = 500) lr_clf.fit(X_train, y_train) pred = lr_clf.predict(X_test) get_clf_eval(y_test, pred)오차행렬 : [[104 14] [ 13 48]] 정확도 : 0.8492, 정밀도 : 0.7742, 재현율 : 0.7869라는 값이 나옵니다.
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
CV세트 기반 스태킹 관련 질문
책과 강의에서는 개별모델이 학습 폴드로 학습하여 테스트 세트를 예측한 결과값들을 평균을 낸다고 나와있습니다. 조금 의문이 드는 것이 메타모델이 학습할 때에는 이진분류의 경우, 0과 1로만 이루어진 패턴을 학습하는 반면, 테스트 데이터셋을 예측할 땐 0과 1 사이의 유리수가 들어올 수 있는데 이 경우, 예측이 잘되는지 궁금합니다. 예를 들어, 이진분류에서 cv=3인 경우, 개별 분류기가 세번에 걸쳐 테스트 데이터 세트의 1행을 1,0,1로 예측했다면 이를 평균하면 0.66입니다. 학습은 0과1로 이루어진 반면, 테스트에서는 0.66처럼 소수점이 포함되어도 아무런 문제가 없는건지 궁금합니다!
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
하이퍼파라미터 이해
매번 좋은 강의 감사합니다 선생님. 하이퍼파라미터를 쓰는 이유는 알겠습니다. 하지만 언제 어떻게 어떤 하이퍼파라미터 써야하는지, 또 무엇을 의미하는지 완벽하게 이해가 안가서 질문드립니다. 너무 기초적인 질문이라서 죄송합니다 ㅠㅠㅠ
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
Smote 설치 오류
conda install -c conda-forge imbalanced-learn 설치했는데 자꾸 'SMOTE' object has no attribute 'fit_sample' 에러가 뜹니다 질문게시판을 참고하여 pip install -U scikit-learnpip install -U imbalanced-learn 다음과 같이 conda prompt에서 pip install 을 하여도 계속 똑같은 오류가 나옵니다 ㅠㅠㅠ 방법이 있을까요??? 강의와 관련있는 질문을 남겨주세요.• 강의와 관련이 없는 질문은 지식공유자가 답변하지 않을 수 있습니다. (사적 상담, 컨설팅, 과제 풀이 등)• 질문을 남기기 전, 비슷한 내용을 질문한 수강생이 있는지 먼저 검색을 해주세요. (중복 질문을 자제해주세요.)• 서비스 운영 관련 질문은 인프런 우측 하단 ‘문의하기’를 이용해주세요. (영상 재생 문제, 사이트 버그, 강의 환불 등) 질문 전달에도 요령이 필요합니다.• 지식공유자가 질문을 좀 더 쉽게 확인할 수 있게 도와주세요.• 강의실 페이지(/lecture) 에서 '질문하기'를 이용해주시면 질문과 연관된 수업 영상 제목이 함께 등록됩니다.• 강의 대시보드에서 질문을 남길 경우, 관련 섹션 및 수업 제목을 기재해주세요. • 수업 특정 구간에 대한 질문은 꼭 영상 타임코드를 남겨주세요! 구체적인 질문일수록 명확한 답을 받을 수 있어요.• 질문 제목은 핵심 키워드를 포함해 간결하게 적어주세요.• 질문 내용은 자세하게 적어주시되, 지식공유자가 답변할 수 있도록 구체적으로 남겨주세요.• 정확한 질문 내용과 함께 코드를 적어주시거나, 캡쳐 이미지를 첨부하면 더욱 좋습니다. 기본적인 예의를 지켜주세요.• 정중한 의견 및 문의 제시, 감사 인사 등의 커뮤니케이션은 더 나은 강의를 위한 기틀이 됩니다. • 질문이 있을 때에는 강의를 만든 지식공유자에 대한 기본적인 예의를 꼭 지켜주세요. • 반말, 욕설, 과격한 표현 등 지식공유자를 불쾌하게 할 수 있는 내용은 스팸 처리 등 제재를 가할 수 있습니다.
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
코드에서 default값 보기
선생님 강의에서 코드의 default값을 종종 보시는데 어떻게 보는지 모르겠습니다 ㅠㅠ 마우스로 클릭하고 어떻게해야 default값을 볼수있나요??? 강의와 관련있는 질문을 남겨주세요.• 강의와 관련이 없는 질문은 지식공유자가 답변하지 않을 수 있습니다. (사적 상담, 컨설팅, 과제 풀이 등)• 질문을 남기기 전, 비슷한 내용을 질문한 수강생이 있는지 먼저 검색을 해주세요. (중복 질문을 자제해주세요.)• 서비스 운영 관련 질문은 인프런 우측 하단 ‘문의하기’를 이용해주세요. (영상 재생 문제, 사이트 버그, 강의 환불 등) 질문 전달에도 요령이 필요합니다.• 지식공유자가 질문을 좀 더 쉽게 확인할 수 있게 도와주세요.• 강의실 페이지(/lecture) 에서 '질문하기'를 이용해주시면 질문과 연관된 수업 영상 제목이 함께 등록됩니다.• 강의 대시보드에서 질문을 남길 경우, 관련 섹션 및 수업 제목을 기재해주세요. • 수업 특정 구간에 대한 질문은 꼭 영상 타임코드를 남겨주세요! 구체적인 질문일수록 명확한 답을 받을 수 있어요.• 질문 제목은 핵심 키워드를 포함해 간결하게 적어주세요.• 질문 내용은 자세하게 적어주시되, 지식공유자가 답변할 수 있도록 구체적으로 남겨주세요.• 정확한 질문 내용과 함께 코드를 적어주시거나, 캡쳐 이미지를 첨부하면 더욱 좋습니다. 기본적인 예의를 지켜주세요.• 정중한 의견 및 문의 제시, 감사 인사 등의 커뮤니케이션은 더 나은 강의를 위한 기틀이 됩니다. • 질문이 있을 때에는 강의를 만든 지식공유자에 대한 기본적인 예의를 꼭 지켜주세요. • 반말, 욕설, 과격한 표현 등 지식공유자를 불쾌하게 할 수 있는 내용은 스팸 처리 등 제재를 가할 수 있습니다.
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
주니터노트북 커널죽음
LightGBM을 실행시키면 계속 커널이 죽는다고 뜨는데 해결방법을 모르겠습니다ㅠㅠㅠ 맥북이용자입니다ㅠㅠ