월 15,400원
5개월 할부 시다른 수강생들이 자주 물어보는 질문이 궁금하신가요?
- 미해결처음하는 파이썬 머신러닝 부트캠프 (쉽게! 실제 문제로 개념/활용 익히기) [데이터과학 Part2]
하이퍼 파라미터 튜닝 기법 적용하기 (SVC 실습)편 13분대 코드 실행 시 에러가 지속 발생합니다.
안녕하세요, 강사님현재 하이퍼 파라미터 튜닝 기법 적용하기(SVC 실습) 편을 수강하고 있습니다. 강의자료 106_PRACTICE_TITANIC_PARAMATER_TUNING에서 라이브러리 임포트 하단, stats.uniform(loc, scale) 부분의 아래 코드를 실행하면 데이터 컨버전 경고가 계속 뜹니다.구글링과 스택오버플로우를 통해서 Y값에 ravel 함수를 적용해서 해결은 했습니다만...1. 왜 이렇게 적용하면 해결이 되는지2. 강사님이 작성해 주신 코드를 그대로 사용했는데 왜 강사님은 정상적인 결과가 나오고 저는 별도로 ravel 함수를 사용해야 나오는지부분은 구글링을 해봐도 찾을 수 없어 문의 드립니다. 요 며칠 계속 추운데 감기 조심하시고 따뜻한 연말 되세요.감사합니다.
- 미해결처음하는 파이썬 머신러닝 부트캠프 (쉽게! 실제 문제로 개념/활용 익히기) [데이터과학 Part2]
판다스 transform 함수
머신러닝 적용을 위한 Feature Enginerring 작업2 강의 9:00 부분에서,# transform 함수 df["Age"].fillna(df.groupby("Initial")["Age"].transform("median"), inplace=True)위와 같은 코드로 transform 함수를 적용하셨는데요,df["Age"].fillna(df.groupby("Initial")["Age"].median(), inplace=True) df.head()아래의 코드처럼 groupby와 median 함수를 사용해도 그 작동 방식은 똑같다고 이해해도 되는 것인지 궁금합니다!
- 미해결처음하는 파이썬 머신러닝 부트캠프 (쉽게! 실제 문제로 개념/활용 익히기) [데이터과학 Part2]
mac os에서 from lightbgm import LGBMClassifier 부분이 실행되지 않을 때
안녕하세요, 같은 문제를 겪는 분들이 있으실까 싶어서 함께 공유드립니다.저의 경우 아래와 같은 이슈가 있었습니다.!pip install lightgbm > 정상 설치 완료되었다고 안내가 떴지만, 이후 강의자료에서 각 라이브러리 임포트 시 no such file 에러 발생구글링 결과 맥 사용자 일부에게서 공통적으로 나타나는 이슈인 것 같습니다. (참고 링크: https://stackoverflow.com/questions/44937698/lightgbm-oserror-library-not-loaded) 저의 경우에는 터미널을 통해 cmake 어쩌고...나오는 부분은 이해가 되지 않아 다른 답변을 찾던 중, 주피터 노트북에서 아래와 같이 실행하면 해결되었다는 답변을 발견했습니다.conda install lightgbm위 코드를 실행하고 몇 분 간 기다리면 결과 화면이 쭈욱 나오는데요, 이때 강의자료에 있는 라이브러리 임포팅 코드들을 다시 실행했더니 정상적으로 lightgbm 라이브러리 임포팅이 완료되었습니다.다만, 처음에 답변을 달아 주신 분과 저 모두 m1 mac을 사용하는 환경에서 해결되었습니다. 위의 방법으로 해결되지 않으셨을 경우에는 첨부 드린 링크 참고하시면 좋을 것 같습니다.다들 파이팅입니다. 감사합니다.
- 미해결처음하는 파이썬 머신러닝 부트캠프 (쉽게! 실제 문제로 개념/활용 익히기) [데이터과학 Part2]
''kaggle'은(는) 내부 또는 외부 명령, 실행할 수 있는 프로그램, 또는 배치 파일이 아닙니다.' 문제가 발생했을 경우..
혹시나 수업을 들으면서 위와 같은 문제가 생기셨을 분들을 위해 남깁니다.시스템 환경 변수 -> 환경 변수 -> 시스템 변수 Path 편집 -> c:\users\<username>\appdata\roaming\python\python39\site-packages path변수에 추가해당 변수에 경로를 붙어넣기 해도 문제가 해결이 되지 않는 경우https://github.com/Kaggle/kaggle-api 참고하시면 좋을 것 같아요!
- 미해결처음하는 파이썬 머신러닝 부트캠프 (쉽게! 실제 문제로 개념/활용 익히기) [데이터과학 Part2]
베이즈 룰 관련 질문
안녕하세요 선생님 우선 좋은 강의 감사드립니다:)다름이 아니라 간단한 질문이 있어 글을 올립니다.혹시 이러한 베이즈 룰이 소위 말하는 A/B testing에 기본이 되는 룰인건가요?
- 미해결처음하는 파이썬 머신러닝 부트캠프 (쉽게! 실제 문제로 개념/활용 익히기) [데이터과학 Part2]
안녕하세요 수업 자료 다운받을수 있을까요?
안녕하세요수업 자료 파일을 받고 싶은데(개인적인 공부를 위하여)파일 다운 받을수 있을까요?funtaland@gmail.com감사합니다
- 미해결처음하는 파이썬 머신러닝 부트캠프 (쉽게! 실제 문제로 개념/활용 익히기) [데이터과학 Part2]
머신러닝 적용을 위한 Feature Engineering 질문
안녕하세요. 강의 잘 듣고 있습니다 :) 머신러닝 적용을 위한 Feature Engineering 강의 15:00 에 질문이 있습니다. 여기서 casual_log, registered_log 데이터를 가지고 학습을 시킨 뒤 역함수를 활용하여서 원래값인 casual count, registered_count 예측값을 구하잖아요? 근데 처음부터 학습데이터의 casual count, registered_count 로 학습시키고 test 데이터의 casual count, registered_count 예측값을 구하면 되는 것 아닌가요? 왜 불편하게 로그데이터로 학습을 시키는지 이해가 안됩니다. 답변 부탁드립니다. 감사합니다 :) log 값으로 학습시키는 게 아니라
- 미해결처음하는 파이썬 머신러닝 부트캠프 (쉽게! 실제 문제로 개념/활용 익히기) [데이터과학 Part2]
안녕하세요. 추가 질문 답변 부탁드립니다~!
안녕하세요. 추가 질문 드린지 꽤 오래 지났는데 아직 답변을 받지 못해서용 답변 부탁드립니다 :) https://www.inflearn.com/questions/610946
- 미해결처음하는 파이썬 머신러닝 부트캠프 (쉽게! 실제 문제로 개념/활용 익히기) [데이터과학 Part2]
스케일링 이해와 kaggle 제출하기 강의 질문
안녕하세요. 강의 잘 듣고 있습니다 :) Q 스케일링 이해와 kaggle 제출하기 17분 40초 부분 submission_df['PassengerId'] = df_test['PassengerId']submission_df['Survived'] = probs['final'].tolist() 위 코드에서 tolist() 를 빼고 submission_df['Survived'] =probs['final'] 로 하면 왜 안되나요?? submission_df['Survived'] 도 데이터 타입이 시리즈이고 probs['final']도 시리즈 데이터 타입인데 왜 tolist() 를 붙여야 값이 제대로 들어가는지 궁금합니다.. 답변 부탁드립니다. 감사합니다.
- 미해결처음하는 파이썬 머신러닝 부트캠프 (쉽게! 실제 문제로 개념/활용 익히기) [데이터과학 Part2]
하이퍼 파라미터 튜닝 기법 적용하기 (SVC 실습) 질문
하이퍼 파라미터 튜닝 기법 적용하기 (SVC 실습) 강의 12분 19초 해당 부분에서 SVC(random_state = 1) 와 같이 random_state 를 지정해주는 부분이 있는데요. 기존에 제가 가지고 있던 생각은 SVC 모델의 경우 학습데이터에서 랜덤하게 샘플링해서 학습하는 게 아니라 학습데이터를 통째로 활용하는줄 알았거든요.. 혹시 SVC 모델이 decision boundary 를 결정할 때 학습데이터를 통으로 사용하는 것이 아니라 bootstrap 방식처럼 전체 학습데이터에서 랜덤하게 샘플링한 데이터를 활용하기에 random_state 옵션이 따로 있는 것인가요? 답변 부탁드립니다. 감사합니다. :)
- 미해결처음하는 파이썬 머신러닝 부트캠프 (쉽게! 실제 문제로 개념/활용 익히기) [데이터과학 Part2]
중요도 이해하고 적용하기 질문
안녕하세요. 강의 잘 듣고 있습니다 :) 41강 중요도 이해하고 적용하기 7분 20초에서 각 모델들을 학습시키기 위해 alg.fit() 을 적용시키는 부분이 있는데요! 40강에서 교차검증을 통해 KNN 의 예측력을 보여줄 때는 KNN 알고리즘에 fit() 을 적용시키는 부분이 없습니다. 없는데 어떻게 학습을 해서 예측점수를 낸 건가요..? 아래 이미지는 knn 교차검증 한 코드입니다. 41강과 다르게 40강 해당 셀에는 fit() 으로 학습시키는 부분이 없어서 어느 부분에서 knn을 학습데이터로 학습시킨건지 궁금합니다. 답변 부탁드립니다~!
- 미해결처음하는 파이썬 머신러닝 부트캠프 (쉽게! 실제 문제로 개념/활용 익히기) [데이터과학 Part2]
feature 중요도 질문입니다.
안녕하세요~ feature 중요도 관련하여 질문 드립니다. 105_PRACTICE_TITANIC_IMPORTANCE 파일의 아래 부분에서, for alg in tree_models: try: print(alg.__class__.__name__) print(alg.feature_importances_) except: print(alg.__class__.__name__, "X") try 구문에서 먼저 alg.fit(x_train, y_train)을 학습시키지 않아도 되는지 궁금합니다. (이게 없으면 어떤 데이터의 feature를 기준으로 alg.feature_importances_ 를 실행할까? 라고 생각해서요.) 답변 기다리겠습니다. 감사합니다~
- 미해결처음하는 파이썬 머신러닝 부트캠프 (쉽게! 실제 문제로 개념/활용 익히기) [데이터과학 Part2]
분류 모델 질문입니다.
분류 모델은 타이타닉의 생존자가 살았다 or 죽었다 처럼 2가지의 답중에 하나만 예측하는것만 가능한가요? 예를들어 날씨가 맑음, 흐림, 비, 눈 처럼 4가지 범주에서 예측하지는 못하나요? 할수있다면 어떤 모델을 공부하면될까요?
- 미해결처음하는 파이썬 머신러닝 부트캠프 (쉽게! 실제 문제로 개념/활용 익히기) [데이터과학 Part2]
자전거 공유 문제 이해와 EDA1에서 데이터 다운로드 403에러
저처럼 헤메는 분 계실까 싶어서 남깁니다. 403 에러나면서 다운로드가 안되면 홈페이지 (https://www.kaggle.com/competitions/bike-sharing-demand/data) 에 가셔서 아래쪽에 competition term에 동의하셔야 다운로드가 됩니다
- 미해결처음하는 파이썬 머신러닝 부트캠프 (쉽게! 실제 문제로 개념/활용 익히기) [데이터과학 Part2]
판다스 데이터프래임 질문드립니다.
처음하는 파이썬 머신러닝 타이타닉 문제로 시작하는 EDA:범주형 데이터 분석 패턴1 약 15:54초 쯤에 나오는 함수내에 데이터프래임 survived = train[train['Survived']==1][feature].value_counts() 은 train이라는 데이터프래임중에서 조건에 맞는 값은 추려내는 문법인가요? 이전에 배웠던 강의에서 못본 문법같아서 문의드립니다. 혹시 이전에 강의때 위 문법이 사용되었다면 위치좀 부탁드리겠습니다....
- 미해결처음하는 파이썬 머신러닝 부트캠프 (쉽게! 실제 문제로 개념/활용 익히기) [데이터과학 Part2]
Bayesian Optimization XGBoost 적용 실행시 오류
'Bayesian Optimization XGBoost 적용' 코드 실행시 아래처럼 iteration이 진행되다가 10번 이후에 에러가 납니다. | iter | target | colsam... | gamma | learni... | max_depth | min_ch... | n_esti... | subsample | ------------------------------------------------------------------------------------------------------------- | 1 | 0.817 | 0.7085 | 3.602 | 0.01006 | 5.116 | 1.468 | 183.1 | 0.5931 | | 2 | 0.8283 | 0.6728 | 1.984 | 0.274 | 5.934 | 6.852 | 284.0 | 0.9391 | | 3 | 0.8272 | 0.5137 | 3.352 | 0.2145 | 6.911 | 1.404 | 278.3 | 0.9004 | | 4 | 0.8081 | 0.9841 | 1.567 | 0.3492 | 9.135 | 8.946 | 176.5 | 0.5195 | | 5 | 0.8114 | 0.5849 | 4.391 | 0.05819 | 5.948 | 9.579 | 579.8 | 0.8459 | | 6 | 0.8249 | 0.6578 | 3.433 | 0.419 | 3.128 | 7.501 | 990.0 | 0.8741 | | 7 | 0.8081 | 0.6402 | 3.946 | 0.06058 | 6.135 | 9.086 | 364.3 | 0.6439 | | 8 | 0.816 | 0.565 | 0.09683 | 0.3426 | 4.481 | 2.655 | 542.4 | 0.5267 | | 9 | 0.8306 | 0.7871 | 0.7336 | 0.2988 | 7.898 | 1.023 | 472.7 | 0.8472 | | 10 | 0.8171 | 0.7071 | 0.2498 | 0.2726 | 7.647 | 5.149 | 950.1 | 0.7933 | --------------------------------------------------------------------------- StopIteration Traceback (most recent call last) File /usr/local/lib/python3.9/site-packages/bayes_opt/bayesian_optimization.py:179, in BayesianOptimization.maximize(self, init_points, n_iter, acq, kappa, kappa_decay, kappa_decay_delay, xi, **gp_params) 178 try: --> 179 x_probe = next(self._queue) 180 except StopIteration: File /usr/local/lib/python3.9/site-packages/bayes_opt/bayesian_optimization.py:25, in Queue.__next__(self) 24 if self.empty: ---> 25 raise StopIteration("Queue is empty, no more objects to retrieve.") 26 obj = self._queue[0] StopIteration: Queue is empty, no more objects to retrieve. During handling of the above exception, another exception occurred: TypeError Traceback (most recent call last) Input In [22], in <module> 36 optimizer = BayesianOptimization( f=xgboost_hyper_param, pbounds=pbounds, random_state=1) 37 # init_points: 초기 랜덤 포인트 갯수 38 # acq='ei': Expected Improvement 39 # xi=0.01: exploration(불확실성이 가장 높은 점 근처에 최적값이 존재할 것이라는 가정으로 계산된 값) 강도 (보통 0.01) ---> 40 optimizer.maximize(init_points=10, n_iter=100, acq='ei', xi=0.01) File /usr/local/lib/python3.9/site-packages/bayes_opt/bayesian_optimization.py:182, in BayesianOptimization.maximize(self, init_points, n_iter, acq, kappa, kappa_decay, kappa_decay_delay, xi, **gp_params) 180 except StopIteration: 181 util.update_params() --> 182 x_probe = self.suggest(util) 183 iteration += 1 185 self.probe(x_probe, lazy=False) File /usr/local/lib/python3.9/site-packages/bayes_opt/bayesian_optimization.py:131, in BayesianOptimization.suggest(self, utility_function) 128 self._gp.fit(self._space.params, self._space.target) 130 # Finding argmax of the acquisition function. --> 131 suggestion = acq_max( 132 ac=utility_function.utility, 133 gp=self._gp, 134 y_max=self._space.target.max(), 135 bounds=self._space.bounds, 136 random_state=self._random_state 137 ) 139 return self._space.array_to_params(suggestion) File /usr/local/lib/python3.9/site-packages/bayes_opt/util.py:65, in acq_max(ac, gp, y_max, bounds, random_state, n_warmup, n_iter) 62 continue 64 # Store it if better than previous minimum(maximum). ---> 65 if max_acq is None or -res.fun[0] >= max_acq: 66 x_max = res.x 67 max_acq = -res.fun[0] TypeError: 'float' object is not subscriptable
- 미해결처음하는 파이썬 머신러닝 부트캠프 (쉽게! 실제 문제로 개념/활용 익히기) [데이터과학 Part2]
코드 실행시 에러가 나면서 결과가 나오지 않습니다.
"6. Logistic Regression 주요 하이퍼 파라미터"의 코드를 실행시키면 아래와 같은 에러 메시지가 무수히 나오면서 결과가 나오지 않습니다. /usr/local/lib/python3.9/site-packages/sklearn/linear_model/_logistic.py:814: ConvergenceWarning: lbfgs failed to converge (status=1): STOP: TOTAL NO. of ITERATIONS REACHED LIMIT. Increase the number of iterations (max_iter) or scale the data as shown in: https://scikit-learn.org/stable/modules/preprocessing.html Please also refer to the documentation for alternative solver options: https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression n_iter_i = _check_optimize_result( /usr/local/lib/python3.9/site-packages/sklearn/linear_model/_logistic.py:814: ConvergenceWarning: lbfgs failed to converge (status=1): STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.
- 미해결처음하는 파이썬 머신러닝 부트캠프 (쉽게! 실제 문제로 개념/활용 익히기) [데이터과학 Part2]
베이즈 정리 활용과 머신러닝 프로세스(0340)
03분40초 주변확률 계산 P(결과) 값 계산 관련 질문 드립니다. 제 풀이는 기존에 A상자와 B상자 딸기맛 비유 드신걸 생각해서 아래와 같이 스팸x, 스팸o의 두가지 상자에서 쿠폰을 선택하는 방식을 풀었습니다. 스팸 x / 50개 - 스팸 x, 쿠폰 o : 15개 - 스팸x , 쿠폰 x : 35개 스팸 0 / 50개 - 스팸o, 쿠폰o : 25개 - 스퍀 x, 쿠폰x : 25개 질문 : P(쿠폰)값을 아래와 같이 계산하지 않고, 단순히 총 쿠폰의 개수(40) / 총 메일의 개수(100)로 계산하신 이유가 궁금합니다. P(쿠폰)의 값 P(스팸x) * P(쿠폰o|스팸x) + P(스팸o)*P(쿠폰o|스팸o) 위와 같이 계산하여 7/20이라는 값이 나왔습니다.
- 미해결처음하는 파이썬 머신러닝 부트캠프 (쉽게! 실제 문제로 개념/활용 익히기) [데이터과학 Part2]
[질문] cross_val_score 코드 실행 시 TypeError 발생
안녕하세요 선생님 선생님 강의를 듣고 있는 초보 학생 입니다. 첫번째 강의 잘 듣고 이번 두번째 강의 듣는 주인데 104번 파일 cross_val_score 코드 실행 시 TypeError가 발생 합니다. 에러 메세지는 아래와 같습니다. 전처리한 파일도 올리고 싶지만 파일 업로드가 않되어 에러 메세지만 그림으로 올립니다. 감사합니다.
- 미해결처음하는 파이썬 머신러닝 부트캠프 (쉽게! 실제 문제로 개념/활용 익히기) [데이터과학 Part2]
df.sort_values(['Ticket'], ascending = True)[55:70]
안녕하세요 df.sort_values(['Ticket'], ascending = True)[55:70] 이부분이 이해가안가서그러는데요 df.loc[(df['Embarked'].isnull())] 값으로 인덱스(61,829)를 구한건 알겠는데 df.sort_values(['Ticket'], ascending = True)[55:70]여기서 어떻게 [55:70]를 알수있었나요? 어떻게 ['Ticket'][55:70]행사이에 NaN값이 있는걸 알수있나요