무료
다른 수강생들이 자주 물어보는 질문이 궁금하신가요?
- 미해결핸즈온 머신러닝 2
슬라이드 링크
슬라이드 링크가 깨진 것 같습니다.확인부탁드립니다.
- 미해결핸즈온 머신러닝 2
128페이지의 코드에 대해 질문하고 싶습니다:)
안녕하세요! 128페이지의 코드를 그대로 써서 진행하였는데 오류가 나서 이렇게 질문드립니다. 128페이지의 마지막 코드를 그대로 진행하니 some_digit = X[0] 부분에서 오류가 나며 KeyError: 0 이 뜨게 되었습니다. import matplotlib as mpl import matplotlib.pyplot as plt some_digit = X.loc[0] some_digit_image = some_digit.values.reshape(28, 28) # ndarray plt.imshow(some_digit_image, cmap="binary") plt.axis("off") plt.show() 위의 코드는 제가 X.loc[0]으로 하니 some_digit이 series로 반환되어 some_digit_image에서 some_digit.values.reshape()으로 하는 방식을 취하여 새로 작성한 코드입니다. (결과는 동일하게 나온 것 같았습니다!) 128페이지 뿐만 아니라 132페이지의 코드에서도 비슷한 일이 일어났는데, from sklearn.model_selection import StratifiedKFold from sklearn.base import clone skfolds = StratifiedKFold(n_splits=3, random_state=42, shuffle=True) for train_index, test_index in skfolds.split(X_train, y_train_5): clone_clf = clone(sgd_clf) X_train_folds = X_train.loc[train_index] y_train_folds = y_train_5.loc[train_index] X_test_fold = X_train.loc[test_index] y_test_fold = y_train_5.loc[test_index] clone_clf.fit(X_train_folds, y_train_folds) y_pred = clone_clf.predict(X_test_fold) n_correct = sum(y_pred == y_test_fold) print(n_correct / len(y_pred)) 본래의 코드는 X_train_folds, y_train_folds, X_test_fold, y_test_fold를 지정할 때 loc이 붙지 않는 코드였지만 이것 또한 위의 상황과 비슷하게 인덱싱이 잘못되었다고 나오며 loc를 붙이니 진행이 되었습니다. 왜 이런 상황이 발생하는지, 계속 이러한 방식으로 인덱싱을 해야 하는 것인지 여쭤보고 싶습니다:)
- 미해결핸즈온 머신러닝 2
[89페이지] 테스트 세트의 소득 카테고리 비율에 대해 질문이 있습니다.
안녕하세요:) 항상 잘 보고 있습니다. 89페이지의 strat_test_set["income_cat"].value_counts() / len(strat_test_set) 부분에서 질문이 있습니다. 앞의 부분의 코드도 책과 다르게 작성한 부분이 없고, 이 전까지는 전부 똑같은 결과가 나오다가 이 라인에서 결과 값이 3 0.350533 2 0.318798 4 0.176357 5 0.114341 1 0.039971 Name: income_cat, dtype: float64 이렇게 나오게 되었습니다. 네번째와 다섯번째 줄의 결과를 보면 소수점 네 자리 수부터 조금씩 다르게 나오고, 점점 진행하다 보니 나중에는 116페이지의 grid_search.best_params_ 코드를 진행할 때에도 max_features의 값이 6으로 나오는 등 계속해서 결과값이 달라지게 되었습니다. 이 부분에 대해서 어떤 식으로 해결하는 것이 좋을지 여쭤보고 싶습니다! 감사합니다:)
- 미해결핸즈온 머신러닝 2
훈련-개발 세트 문의
훈련-개발 세트는 예시를 들면 모바일 환경에서 얼굴을 인식하는 분류기를 만든다고 할 때, 데이터를 확보하기 위해 구글에 올라온 고해상도 이미지를 크롤링하여 고화질의 이미지를 얻지만 실제로는 다양한 해상도의 이미지로 사용될 때 성능이 안좋다면 과대적합인지 데이터 불일치인지 모르기 때문에 훈련-개발세트를 두는 것이고 이는 검증셋과는 별개이므로 이 때에는 훈련, 훈련-개발, 검증, 테스트로 나누는 방법으로 이해했는데 맞게 이해한 것일까요? ( 데이터를 훈련, 검증, 테스트로 나누는 것으로 인지했습니다. 그 중 훈련 데이터는 오로지 학습을 위해 사용되는 것이고 검증 셋은 하이퍼 파라미터 조정이나 여러 모델 중 가장 우수한 모델을 선택할 때 사용하는 것, 테스트 데이터는 머신러닝의 최종 성능 평가할 목적으로 사용되는 것으로 이해했습니다. ) 질문이 장황해 죄송합니다.
- 미해결핸즈온 머신러닝 2
[84페이지] 특성값의 히스토그램 설명 부분
안녕하세요. 강의에 많은 도움을 받고 있습니다 :) 84페이지에, 특성값의 설명부분에서, 특성값이 최대값을 한정한 경우로, 머신러닝 예측 시 예측값이 최대값을 넘지않도록 학습될 수 있다고 설명하는데요. 저는 반대로, 예측값이 최대값을 넘어가지 않도록 구현하고자 합니다. 따로 방법이 있을까요? 아래 그림은 인공신경망 알고리즘을 통해, 미니배치로 반복 훈련하여 얻은 성능입니다. 타깃특성의 최댓값이 100으로 한정되어있는데, 예측 시 100이상의 값이 나와, test 성능이 떨어집니다. 어떻게 해야할까요?
- 미해결핸즈온 머신러닝 2
2부 강의에 관련하여
안녕하세요! 최근에 머신러닝에 관심이 생겨 공부하하기 시작한 입문자입니다. 강의 너무 잘 듣고 있습니다 :) 다름이아니라 강의 목록을 보니 현재 1부 강의만 업로드된 걸로 알고 있는데, 2부 강의는 언제 업로드 되는지 알 수 있을까요?
- 미해결핸즈온 머신러닝 2
mnist 데이터가 안 불러와집니다.
안녕하세요. 다음과 같은 오류 해결법좀 부탁드립니다.
- 미해결핸즈온 머신러닝 2
책 내용 다시 질문합니다.
저자님 안녕하세요. 친절하게 답변해주셔서 고맙습니다. 그런데 다음과 같이 에러가 뜨는데 어떻게 조치해야할까요?
- 미해결핸즈온 머신러닝 2
책 내용 질문입니다.
안녕하세요. 저자님의 책으로 처음 공부를 시작한 사람입니다. 근데 75p 2.3.1 작업환경 만들기부터 막혔습니다. 강의에서는 설명해주실까해서 강의를 보았는데, 프로그래밍을 아는 사람을 대상으로 하는 강의 같아서 결국 질문 남깁니다. "그다음엔 머신런이 코드와 데이터셋을 저장할 작업 디렉터리를 만듭니다. 터미널을 열고 다음 명령을 실행합니다($ 프롬포트 다음이 명령입니다)." 라고 책에 써있는데, 1. 디렉터리를 만든다는 게 폴더를 만든다는 뜻인지 궁금합니다. 2. 터미널을 열으라는데 터미널이 무엇인가요?
- 미해결핸즈온 머신러닝 2
대용량 데이터 전처리 [분산 환경 수행] 방법
안녕하세요. 딥러닝 인공지능에 대한 학습을 마치고 핸드온으로 이어서 강의를 수강하고 있습니다. 먼저 좋은 강의 올려 주셔서 감사 합니다. 강의를 듣고 있는 중에 실제 현업에 적용시 궁금한 사항이 있어서 이렇게 질문을 남깁니다. • pandas를 이용해 전처리를 수행 중에 대용량 데이터 건수를 전처리 하는 기능. 병렬 프로세스가 아닌 분산 환경에서 전처리를 할 수 있는 방법이 있을까요? 또 분산 환경에서 전처리를 수행할 경우 성능 개선 및 안정성, 효용성이 좋은 기술이 있을지 궁금합니다. 인터넷으로 검색하다 보면 modin/dask 등 몇 개의 라이브러리가 있던데 성능과 안정성, 유용성 등을 실제 경험해 보지 않아서 잘 모르겟습니다.
- 미해결핸즈온 머신러닝 2
jupyterlab 관련해서 여쭤봐도 될까요?ㅠ
python 3.9.1 을 사용하고 있고 jupyterlab 만 pip 를 통해 설치했는데 일단 동작은 정상적으로 합니다. 다만, 제가 알기로 tab 을 누르면 자동완성 기능이 되는 것으로 알고 있는데 아래과 같은 오류가 발생합니다. 혹시 anaconda 를 통해 설치 하신 건가요? 아니면 제가 뭔가 잘못 설치를 했을까요?ㅠ File "c:\users\hellojay\documents\programming\python\venv\jupyter-test\lib\site-packages\IPython\core\completer.py", line 2029, in _complete completions = self._jedi_matches( File "c:\users\hellojay\documents\programming\python\venv\jupyter-test\lib\site-packages\IPython\core\completer.py", line 1373, in _jedi_matches interpreter = jedi.Interpreter( File "c:\users\hellojay\documents\programming\python\venv\jupyter-test\lib\site-packages\jedi\api\__init__.py", line 725, in __init__ super().__init__(code, environment=environment, TypeError: __init__() got an unexpected keyword argument 'column' [I 2020-12-27 01:42:03.610 ServerApp] Interrupted... [I 2020-12-27 01:42:03.612 ServerApp] Shutting down 1 kernel
- 미해결핸즈온 머신러닝 2
결측값 대체와 표준화에 관련해서 질문드립니다!
1. test set의 결측값은 train set의 median(혹은 mean 등)으로 대체한다고 교재에서 나와있습니다. test set의 median을 사용하면 안되는 이유가 훈련세트에서 학습한 것이 소용없어진다고 설명되어있는데 왜 소용이 없어지는건가요? 데이터의 중앙값을 결측치로 대체하는 것을 모델의 일부라고 생각하면 가능한 것 아닌가요?? 2. 교재(107p)에서 scaling은 훈련 세트에만 먼저 적용 후, 훈련세트와 테스트 세트에 대해 transform() 메서드를 사용한다고 나와있습니다. 이 말의 뜻이 이해가 잘 안됩니다.. 표준화로 예를 들면 다음과 같은 과정을 거치는것이 맞나요? (tr는 훈련세트를, te는 테스트 세트를 의미합니다) 2-1) 훈련세트의 mean(x_tr), sd(x_tr)을 계산한다. 2-2) 훈련세트에 표준화를 한다 -> (x_{i}-mean(x_tr))/sd(x_tr), for all i = 1, ... n_tr 2-3) 테스트 세트에 표준화를 한다 -> (x_{i}-mean(x_tr))/sd(x_tr), for all i = 1, ... n_te 만약 2-3)의 과정에서 mean(x_tr), sd(x_tr)이 아니라 mean(x_te), sd(x_te)를 사용해야하는 것이라면 1번의 결측값 대체 과정에서는 trian set의 median을 이용해야하고 스케일링 과정에서는 왜 test set의 평균과 표준오차를 사용하는 이유가 무엇인가요??
- 미해결핸즈온 머신러닝 2
안녕하세요 2부 강의 기다리고 있습니다
안녕하세요 박해선 저자님! 처음 이 두꺼운 책을 보고 한숨만 내쉬다가 저자님 영상이 인프런에 무료로 배포된 거 보고 바로 강의와 책을 병행하며 학습하고 있는 수강생입니다 :) 진짜..막막하고 무슨 소리인지도 몰랐던 저에게 정말 많은 도움을 주셨어요 지금...제가 머신러닝과 딥러닝을 오가며 공부중이라 2부에 대한 강의가 없더라구요ㅠㅠ 건강은 괜찮아지셨는지요.. 부디 목마른 수강생들에게 오아시스 같은 강의를 만들어주십쇼 ㅠㅠ 열렬히.. 기다리고 있겠습니다 감사합니다
- 미해결핸즈온 머신러닝 2
안녕하세요. 유튜브로 강의 잘 보고 있습니다.
비전공자로서 공부하는 저에게 한줄기 빛과 같은 존재십니다.. 다름이 아니라 svm 이후 강의가 안 올라와서... 기다리고 있는 팬입니다.. 항상 감사하구요... 언제쯤 올라오는지 여쭤볼 수 있을까요? 그리고 강의를 추후에 유료로 전환할 생각이 있으신가요 ㅜㅜ?!