월 19,800원
5개월 할부 시다른 수강생들이 자주 물어보는 질문이 궁금하신가요?
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
train_test_split 할 경우, 무조건 alpha값이 작은 값이 rmse가 작게 나오는 이유?
https://www.inflearn.com/questions/66382 이 질문을 보고 저도 궁금증이 들어서 한번 해봤는데요.. (아래 코드는 '릿지(Ridge) 회귀의 이해 강의' 에서 3:01초 쯤에 나오는 코드입니다.) 기존 강의에서는 alpha값이 클수록 rmse가 작게 나왔는데요. 이건 기존 코드에서 train_test_split 을 추가한 코드인데요~ test_size=0.3 일 경우에 rmse가 alpha값이 작을수록 작게 나왔고, test_size를 아주 작게 0.01로 줄 때에도 alpha값이 작을수록 rmse 가 작게나오는 결과를 얻었습니다. 저도 기존 질문자의 궁금증처럼 왜그러는지 이유가 궁금하네요.. ㅠ!
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
보스턴 그래프 색깔
안녕하세요. boston 집값 예측 그래프에서, 수업시간에는 이 코드로 했을 때는 그래프 색깔이 다 다르게 나오는데, 버젼이 틀려서 그런지 제꺼에는 다 같게 나오더라구요. regplot 안에 col = 'feature'라고 넣으면 feature 별로 그래프 색깔이 다 다르게 나오지 않을까 했는데 이렇게 하면 에러가 뜨더군요. 그래프 색깔을 다 다르게 해주려면 어떤걸 넣어야하고, 이렇게 하면 왜 에러가 뜨는지 설명해주실 수 있나요?
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
데이터셋
해당 데이터 셋은 다운로드 받으면 초기 파일명을 변경하기 전엔 3가지 파일(santander-customer-satisfaction , test, train) 이렇게 구성되어 있는데. train 모델만 사용하여 train 데이터를 train: test = 0.8 : 0.2 로 사용하셨잖아요. 근데 학습된 모델을 평가하기 위해선 TARGET 행이 없는 test 데이터 파일을 사용하셔야 되지 않나요?
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
PolynomialFeatures 에서
선생님~ 기존 강의와 코드에서는 fit_transform 인자로 (X_train, y_train) 둘다 들어갔는데 X_train만 넣어도 X_train.shape 결과는 똑같이 나오더라고요.. y_train도 넣어주는 이유가 있나요? 피처를 다항 선생님~ (1번코드) 기존 강의와 코드에서는 fit_transform 인자로 (X_train, y_train) 둘다 들어갔는데 (2번코드) X_train만 넣어도 X_train.shape 결과는 똑같이 나오더라고요.. y_train도 넣어주는 이유가 있나요? PolynomialFeatures가 피처엔지니어링 기법으로 피처를 다항식으로 변환하기 위함인데.. y_train은 왜 넣어주셨는지 궁금합니다.
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
coef_ 의 shape 관련
선생님~ 이전 강의 ppt 와 책(개정판)에서도 확인해보니 coef_ 의 shape를 보면 (Target값개수, 피처개수) 이렇게 적혀있는데.. lr.coef_.shape 해보니 (13, ) 이 나오는데 coef_의 shape는 (피처갯수,) 아닌가요~?
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
stochastic_gradient_descent_steps 함수에서
선생님 ~ stochastic_gradient_descent_steps 함수에서 prev_cost = 100000는 왜 들어간건가요~? 어디서 쓰이는건지.. 함수에서 쓰이지 않는 것 같은데.. 무슨용도인지 모르겠네요..ㅜ
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
w1[0,0] 하는 이유
선생님~ w1, w0을 그냥 print 해보면 값이 다 하나씩 나오는데.. 왜 위치인덱스[0,0] 을 해주는지 모르겠어요..ㅠ
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
선생님~
강의에서는 step3 부분에서 더이상 비용함수의 값이 감소하지 않으면 중지한다고 나오는데.. 이 코드 부분에서는 중지하는 코드가 없고 그냥 10000번 다 돌리는거 아닌가요..? 경사하강법 파이썬 코드 어느 부분에서 step3 부분의 내용이 있는지 궁금합니다.
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
get_weigtht_updates() 함수 부분
선생님~ 식으로 봤을 때 마이너스까지 포함한 노란색 부분이 각각 w1_update, w0_update 아닌가요..? 그러면 식이 w1 = w1 +w1_update w0 = w0 + w0_update '+'로 되어야 하는 거 아닌가용..? 왜 '-'인지 ..헷갈리네요..ㅠ
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
라즈베리파이 프로젝트와 관련하여 질문이 있습니다.
안녕하세요. 라즈베리파이 프로젝트와 관련하여 질문이 있습니다. 라즈베리파이에서 카메라를 통해 얼굴 인식 등의 프로젝트를 진행하고 싶습니다. 현재 파이썬의 기본적인 프로그래밍 능력만 갖추고 있으며, 데이터를 분석하는 능력은 없습니다. 처음에는 선생님의 '파이썬 머신러닝 완벽가이드' 강의를 수강후에 '딥러닝 컴퓨터비전 완벽가이드' 강의를 수강하고자 하였습니다. 하지만 의미있게 두 강의가 이어지지는 않은 것 같습니다. 두 강의를 모두 수강하는 것이 좋은가요? 아니면 '딥러닝 컴퓨터비전 완벽가이드'강의만 들어도 무방한가요? 긴 질문 읽어주셔서 감사합니다.
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
선생님~ 회귀계수 관련
선생님~ 통계학에서 배울 때 회귀계수가 유의한 회귀계수인지 확인할 수 있는 절차가 있었는데요~ (각 독립변수의 회귀계수에 따른 유의확률이 유의수준보다 작아야 유의한 회귀계수로서 회귀식에서 사용하는게 가능하게 되는) 머신러닝에서는 그러한 절차는 없는건가요~? 통계학에서 여러 분석에서 검증할 때 많이 쓰였던 유의확률이나 유의수준은 머신러닝에서 어떠한 개념인지 궁금합니다..
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
GMM에서 최적의 n_component 도출 방법 문의
안녕하세요. 강사님. K-means에서는 최적의 클러스터 개수를 구하기 위해 elbow method나 강의에서 소개해주신 실루엣 계수를 사용하는데(물론 이 방법들로 최적의 클러스터 개수를 반드시 도출한다는 보장은 없지만), GMM에서는 최적의 클러스터 개수를(n_component) 구하기 위해 어떻게 해야하나요?
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
예측값
예측값을 추출하지않았다는 뜻이 될것같아요 성능이 좋은 모델을 만든 후에, 그 모델로 새로운 미지의? 데이터를 예측해보고 그 예측값을 확인하는 것(예측값을 추출해보는것?)이 머신러닝의 목적이라고 이해를 했는데.. 실습예제를 통해서는 모델의 성능평가까지만 나와있어 여쭤보았습니다.
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
Smote 오류..
안녕하세요. 신용카드 사기검출에서 SMOTE 오버 샘플링 하는 부분에서 에러가 떠서 질문 드려요. 처음에는 "cannot import name 'delayed' from 'sklearn.utils.fixes' (c:\users\82106\anaconda3\lib\site-packages\sklearn\utils\fixes.py)" 라는 오류가 뜨다가 이리저리 만져보니 지금은 맨 아래 사진과 같이 'SMOTE' object has no attribute 'fit_sample' 라고 뜨는데 해결책이 있을까요? 강사님이 예전에 다른 분의 질문 'SMOTE' object has no attribute '_validate_data' 답글 달아주신 것 보고, pip install -U scikit-learnpip install -U imbalanced-learn 이거 2개도 시도해봤는데 해결이 안되네요 ㅠ 위 사진이 지금 현재 제 오류 상태입니다!
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
순서대로 공부하고 있는데
선생님~ 순서대로 공부하고 있었는데요~ feature selection 의 코드 부분은 신규로 만들어진 강의라서 그런지.. 이전 강의에서 배우지 않은 부분들이 많이 나와서...그냥 들을려고 했는데..이해되지 않는게 많다보니.. 버거움을 느끼게 되어서요.. 일단은 그냥 넘어가고 나머지 강의 다 듣고, 다시 이 부분을 듣는게 좋을까요? ㅠ
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
RSS
강사님 안녕하세요. 영상에서 비용함수 RSS의 함수식에 1/N이 곱해져 있는데요. 원래 RSS를 N으로 나눈 것은 MSE(Mean Square Error)로 따로 정의 하는데 영상에서 RSS를 MSE 형태로 정의 하신 특별한 이유가 있는지 궁금합니다.
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
예측 행렬 음수값 문의
안녕하세요. 강사님. 강의 초반에 임의 행렬 R로 예측행렬을 구하는 부분에서, R 행렬에 데이터를 추가해서 예측 평점이 어떻게 변하는지 실습해봤습니다. 아래처럼 마지막에 list 하나 추가해주었습니다. 그리고 나머지 과정을 모두 동일하게 하여 Matrix 분해 후 재결합 하였는데 아래와 같이 음수값이 나옵니다. 피쳐 값이 모두 양수인데 내적으로 구한 예측 행렬에 음수 값이 나올 수 있는지요? 그럼 답변 부탁드립니다. 감사합니다.
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
why 7?
cos 유사도가 1이 넘어갑니다,,,,, 왜 그런지알수있나요? 추가로 자기자신과 유사도를 비교했는데 1이 안되는 경우도 있습니다.
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
실시간 추천시스템 구현방법 문의
안녕하세요. 강사님. 원리를 바닥부터 설명해주셔서 추천시스템의 본질을 이해하는데 큰 도움을 받았습니다. 강의에서는 추론 대상이 되는 유저가 남김 평점 데이터를 포함하여 행렬 분해를 하고 학습해서 안 본 영화의 평점을 예상합니다. 그런데 넷플릭스 같은 추천 서비스는 유저가 가입하자마자 자기가 본 영화에 평점을 남기면 즉시 영화를 추천해 주는데, 이것은 어떻게 하는 것인지요? 잠재 요인 기반 협업 필터링을 이용한다면, 유저가 데이터를 입력하자마자 기존 데이터에 추가한 뒤 새롭게 matrix를 분해해서 다시 학습해야 하고 이는 시간이 너무 오래 걸리기에 불가능한 방법으로 보입니다. 그리고 아이템 기반 협업 필터링을 이용한다고 해도 새로운 데이터를 추가해서 다시 학습하면 전체 코사인 유사도가 이전과 달라지고 예상 평점도 달라집니다. ('9.2 아이템 기반 인접 이웃 협업 필터링 실습' 강의에서 영화 데이터의 user 수를 다르게 해서(한 쪽은 모든 유저, 다른 한 쪽은 70번까지 유저 데이터만 이용) 영화 간에 코사인 유사도를 비교해보니 코사인 유사도가 다르게 나오는데, 이 때 아이템 간의 유사도가 다르게 나오는 것이 맞지요?) 신규 유저가 입력한 raw한 평점 데이터 값을 이미 만든 모델에 inference해서 결과값을 받는 웹어플리케이션을 만들어 보고 싶은데, 위 이유 때문에 어떻게 해야할지 감이 안 잡힙니다. 혹시 강의 후반부에서 다뤄주실까 하고 완강했으나 해당 내용은 언급되지 않아 직접 문의드립니다. 감사합니다.
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
선생님 feature selection 파일 다운로드
선생님 ~ PerfectGuid수정ver01.zip 파일은 다운로드 버튼이 있어서 쉽게 받을 수 있었는데.. feature selection 파일은 클릭하면 다운로드 버튼이 없네요.. 깃을 사용해서 다운로드 받아야 하나요..? 깃허브 처음 사용해봐서 ..ㅠ 모르겠네요..