월 19,800원
5개월 할부 시다른 수강생들이 자주 물어보는 질문이 궁금하신가요?
- 해결됨[개정판] 파이썬 머신러닝 완벽 가이드
stacking meta model 선택
안녕하세요 meta model을 선택하는 기준이 궁금합니다.
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
pred에 에러에 대해
안녕하세요 pred를 만들고 출력을 하였는데 AttributeError Traceback (most recent call last) <ipython-input-79-b055092159e4> in <module> 2 print('GridSearchCV 최적 파라미터:{0:.4f}'.format(grid_dtree.best_score_)) 3 pred=grid_dtree.predict(X_test) ----> 4 print('테스트 데이터 세트 정확도: {0:.4f}'.format(accuracy_score(y_test.pred))) AttributeError: 'numpy.ndarray' object has no attribute 'pred'이런 에러가 나타납니다. 원인을 찾아봤는데 함수를 선언한게 없어서 안된다고 하는데 문제가 뭔지 잘 모르겠습니다.
- 해결됨[개정판] 파이썬 머신러닝 완벽 가이드
강의순서 질문드립니다.
저는 궁극적으로 딥러닝과 NLP를 깊게 공부하고자 하는 학생입니다. 현재 파이썬 프로그래밍정도 공부한 상태이고 이후 강사님의 이 머신러닝 완벽가이드와 딥러닝과 컴퓨터 비전 완벽가이드를 들으려고 하는데요. 시간상 딥러닝 강의와 머신러닝 강의를 병행하거나 딥러닝 강의를 먼저 들으려고 하는데 괜찮을까요?? 딥러닝 강의의 선수지식으로 판다스, NUMPY등 머신러닝내용이 필요로 하지는 않을까 우려되는 마음에 질문드립니다.
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
머신러닝 2장 질문입니다
머신러닝을 처음 접하고, 완벽가이드 책과 강사님의 강의를 매우 잘 듣고 있는 수강생입니다.^^ 아직 머신러닝 유아 단계라 몸에 안익숙하긴 하지만, 궁금한게 있어 글 남깁니다! 타이나닉 생존자 예측 부분에서 (데이터 전처리 ->...->예측 수행 -> 평가)이런 흐름으로 코드를 진행하셨는데, 결론이 과연 제가 생각하는게 맞는가 갑자기 의문이 생겼습니다. 질문은 우선, 141P에 중간 단락 첫 문장에 생존자를 예측해보겠습니다. 라고 나와 있는데, 생존자 예측이 현재 사용된 ML 알고리즘의 00% 가 예측의 정도 인거 같은데, 그렇다면!! 가령 임의의 feature 값 은 다음과 같이 정의하고( passengerid = 1 , sex=여, cabin=c 등) , label 값은 미지수로 두었을 경우 '예측 수행 및 best 파라미터의 ML 의 알고리즘' 을 통해 임의의 값을 둔 탑승자의 생존여부 (label = survived)를 알 수 있다는 건가요? 아니면, 단순 datasets을 통해 예측 수행 및 best 파라미터의 ML 알고리즘의 정확성만 나타낼 수 있는 건가요? 이상입니다. 항상 좋은 강의 감사합니다~^^
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
강의순서
전체적으로 머신러닝에 대해 공부해보려고 강의를 수강하게 되었습니다 그러다 최근에 하게된 토이프로젝트에서 추천서비스를 구현해야할거같아 그부분만 먼저 학습을 하고싶은데요 마지막 과에 추천에 관한 내용이 나와있더라구요 혹시 앞부분에서 어떤부분과 마지막 추천부분을 들으면 될지 알 수 있을까요?ㅠㅠ
- 해결됨[개정판] 파이썬 머신러닝 완벽 가이드
Odds(p)를 통해 선형 회귀식에 확률을 적용하는 것
강의에서 이 부분이 이해가 잘 안가서 질문 드립니다. Odds(p)가 뭐길래 선형 회귀식에 확률을 적용할 수 있는지, 왜 Log(Odds(p))가 w1x + w0인지 모르겠습니다. 범위가 (0,무한)이던 Odds(p)에 로그를 취하면 (-무한,무한)이 되는 건 알겠는데... 음.. 그냥 저 과정이 다 뭐하는 과정인지 모르겠습니다. 그냥 p(x) 식만 놓고 보면 회귀 결과값의 범위를 (0,1)로 바꾸기 위해 시그모이드 함수를 썼구나라고 느껴지는데... Log(Odds)의 의미가 무엇인가요??
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
Random Forest Regressor에 보스턴 데이터셋 실습시킬때 질문
안녕하세요 강의 보는 중에 이전 회귀 모델이나 descion tree 모델을 학습시킬때에는 dataset을 train_test_split를 통해서 train_set, test_set으로 나눴지만 Random Forest Regressor 모델을 학습 시킬 때에는 X_data, y_target에 대해서 train_set, test_set으로 나누지 않는 이유가 있나요? 혹시 그 이유가 Random Forest Regrssor에 bootstrap기법때문인가요?
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
apply를 이용하지 않을경우
apply를 이용하지 않는경우는 어떻게 하는지 모르겠습니다 밑의 코드처럼 작성하면 되는데 다른 방법이있나요 list1 = [] for i in titanic_df['Name']: list1.append(len(i)) titanic_df['len_name'] = list1 titanic_df
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
1차원 , 2차원, 3차원 데이터의 차이
1차원, 2차원, 3차원 데이터의 차이는 무엇인 가요? 혹시 예를 들어주실 수 있나여?? 머리에 그려지지 않아 감이 잘 안잡힙니다 ㅠㅠ
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
Unknown label type:'continuous-multioutput질문
안녕하세요 학습 데이터 세트로 학습 수행 부분에서 이런 에러가 뜨는데 다른 코딩 내용으로 바꿔도 에러가 해결이 되질 않네요 다른 방법 없을까요?
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
iris 실습 응용 과정엘서의 질문
안녕하세요 선생님, 잘 지내시나요? 항상 좋은 강의 감사합니다. 더불어, 지난 번 질문에 대한 답변 대단히 감사했습니다^^ 다름이 아니라, 복습을 하던 중 궁금한 점이 생겨 질문을 한번 더 올리게 됐습니다. iris 실습 관련 질문입니다. #DF형성 feature=iris.data target=iris.target columns=iris.feature_names iris=pd.DataFrame(data=feature, columns=columns) iris['target']=target #DF에서 target칼럼을 떼어 와 y값으로, 나머지를 x값으로 만듦 (이미 완성된 DF에서 x와 y데이터를 나눠보는 것도 진행해보면 좋을 것 같아, 수업을 응용해 보았습니다.) target_data=np.array(iris['target']) feature_data=np.array(iris.drop(target_data)) print(feature_data.shape) #값: (147,5) print(target_data.shape) #값: (150,) ---------------------------------------------------------------------------- 결과적으로, 값이 위와 같이 값의 수가 다르게 나와서, 테스트 데이터와 트레인 데이터 분리가 불가능하다는 오류문을 받았습니다. 구글링을 통해 값의 수가 달라서 라는 것까지는 찾아냈는데, 왜 이 코드의 경우 어떤 과정엘서 각 값의 수(147과 150)가 다르게 출력된 것인지 궁금합니다. 그럼 답변 기다리겠습니다, 연말 잘 보내세요^^
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
교차 검증시 검증데이터와 훈련데이터의 중복?
선생님 안녕하세요!선생님 강의를 다 결제한 학생이에욥!일단 문제 상황을 가정해볼께요.예를 들어 3 폴드로 진행한다면모델의 인스턴스 생성후1번째1,2 훈련3 검증2번째1,3 훈련2 검증2,3, 훈련1 검증이렇게 진행하는 것으로 알고 있습니다. 여기서 궁금한 점이 있습니다 1번째는 훈련시 1,2훈련하고 3검증할때는 상관없지만,그 이후인2번째와 3번째의 검증셋인 각각 1,2집합은 이미 첫번째에 훈련데이터에 속해 있지 않나요? 그 훈련 값이 이미 훈련되어 있는데 검증할 때 영향이 또는 상관이 없을까요?모델을 재생성하지 않아도 fit() 훈련할 때 마다 이전에 훈련된 것은 새롭게 초기화 되는건가요?크리스마스 잘보내세요!
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
random_state 질문
안녕하세요. <X_train, X_test, y_train, y_test = train_test_split(iris_data, iris_label, test_size=0.2, random_state=11)> 에서 random_state가 무엇을 의미하나요? 1일 때, 0일때, 11일때 각가 어떤 차이가 있나요?
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
[] 관련 질문
선생님 안녕하세요. 먼저 좋은 강의 해주셔서 감사합니다. 강의를 듣다보면 [ ] 기호가 리스트인지 브레이킷??인지 잘모르겠습니다. 어떻게 구분하면 좋을까요. 너무 초급수준의 질문이라 죄송합니다.
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
훈련데이터와 테스트데이터를 뽑을때 모집단의 특성이 잘 반영되는지 검증은 안해도 되나요?
실전에서표본인 학습데이터와 테스트 데이터를 뽑을때 모집단의 특성(parameter)를 대표하는지 검증을 해야하는지 궁금합니다.
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
PCA관련 문의
안녕하세요. PCA 관련 공부하다가 궁금한게 있어서 질문드립니다. P.385 pca 2차원 축소시 pca component 1, 2 수치에 대해 설명부탁드립니다. 해당값이 고유벡터에 대한 값을 나타내는 것인지, 만약 그렇다면 -는 기존 데이터 위치에서 반대 방향으로 벡터가 이동했다는 뜻인지 궁금합니다.
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
강의자료 관련 질문
강의자료는 어디서 다운로드 할 수 있나요..??
- 해결됨[개정판] 파이썬 머신러닝 완벽 가이드
교차 검증에서 평균 정확도 계산
KFold 교차 검증을 수행하는 코드에서 반복을 5번 하면 학습과 예측도 5번 하잖아요? 그때 이전 반복문의 결과가 이후 반복문의 결과에 영향을 주나요? 1. 그러니까 만약에 영향을 안 준다면 마지막 학습 1번만 하는 것과 다름이 없는데 왜 여러 번 학습을 수행시키는지 궁금합니다. 2. 만약에 영향을 준다면 0.7542 -> 0.78.9 -> 0.7865 -> 0.7697 -> 0.8202 가 우연이 숫자가 증가하는 양상을 띄는 것이아니라 정말로 성능이 좋아지는 것이 맞나요? 만약에 그렇다면 최종 정확도가 중요한 것인데 왜 평균 정확도를 구하나요? 3. 영향을 준다면 2.6 사이킷런에서 수행하는 타이타닉 생존자 예측 코드에서 DecisionTreeClassifier, RandomForestClassifier, LogisticRegression으로 학습/예측/평가를 해본 뒤, KFold 교차 검증에서 앞서 사용한 df_clf를 함수에 인자로 넘겨 재사용하는데, 이것이 문제 없는 것인지 궁금합니다.
- 미해결[개정판] 파이썬 머신러닝 완벽 가이드
판다스읽기가 안됩니다.
안녕하세요 타이타닉 csv가 안 읽어 지는데 경로를 어디로 해야하는지 알고싶습니다 FileNotFoundError Traceback (most recent call last) <ipython-input-8-ce91d8675975> in <module> ----> 1 titanic_df=pd.read_csv('titanic_train.csv') 2 print('titanic 변수 type:', type(titanic_df)) ~\anaconda3\lib\site-packages\pandas\io\parsers.py in read_csv(filepath_or_buffer, sep, delimiter, header, names, index_col, usecols, squeeze, prefix, mangle_dupe_cols, dtype, engine, converters, true_values, false_values, skipinitialspace, skiprows, skipfooter, nrows, na_values, keep_default_na, na_filter, verbose, skip_blank_lines, parse_dates, infer_datetime_format, keep_date_col, date_parser, dayfirst, cache_dates, iterator, chunksize, compression, thousands, decimal, lineterminator, quotechar, quoting, doublequote, escapechar, comment, encoding, dialect, error_bad_lines, warn_bad_lines, delim_whitespace, low_memory, memory_map, float_precision) 684 ) 685 --> 686 return _read(filepath_or_buffer, kwds) 687 688 ~\anaconda3\lib\site-packages\pandas\io\parsers.py in _read(filepath_or_buffer, kwds) 450 451 # Create the parser. --> 452 parser = TextFileReader(fp_or_buf, **kwds) 453 454 if chunksize or iterator: ~\anaconda3\lib\site-packages\pandas\io\parsers.py in __init__(self, f, engine, **kwds) 944 self.options["has_index_names"] = kwds["has_index_names"] 945 --> 946 self._make_engine(self.engine) 947 948 def close(self): ~\anaconda3\lib\site-packages\pandas\io\parsers.py in _make_engine(self, engine) 1176 def _make_engine(self, engine="c"): 1177 if engine == "c": -> 1178 self._engine = CParserWrapper(self.f, **self.options) 1179 else: 1180 if engine == "python": ~\anaconda3\lib\site-packages\pandas\io\parsers.py in __init__(self, src, **kwds) 2006 kwds["usecols"] = self.usecols 2007 -> 2008 self._reader = parsers.TextReader(src, **kwds) 2009 self.unnamed_cols = self._reader.unnamed_cols 2010 pandas\_libs\parsers.pyx in pandas._libs.parsers.TextReader.__cinit__() pandas\_libs\parsers.pyx in pandas._libs.parsers.TextReader._setup_parser_source() FileNotFoundError: [Errno 2] No such file or directory: 'titanic_train.csv'
- 해결됨[개정판] 파이썬 머신러닝 완벽 가이드
DecisionTreeClassifier 객체의 random_state 값
의사 결정 트리 클래스 DecisionTreeClassifier 객체를 생성할 때 코드가 dt_clf = Decision_TreeClassfier(random_state=11) 이렇게 되던데요, random_state 값이 왜 파라미터로 필요한지 궁금해요. 이 객체는 이후에 학습 데이터 와 테스트 데이터를 받아서 학습과 예측을 수행하잖아요?? 이 과정에서 학습 데이터와 테스트 데이터가 어떻게 분리되었는지는 알 필요가 없는데 이 값이 왜 들어가나요???