묻고 답해요
158만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
hyperopt 오류
안녕하세요 , 항상 고생많으십니다.다름이 아니라 , hyperopt 마지막 실습 중에 다음의 코드에서 오류가 발생합니다. hyperopt version도 실습과 같은데, 왜 이런 오류가 발생하는지 몰라서 질문드립니다.from hyperopt import fmin, tpe, Trials trial_val = Trials() best = fmin(fn=objective_func, space=xgb_search_space, algo=tpe.suggest, max_evals=50, # 최대 반복 횟수를 지정합니다. trials=trial_val, rstate=np.random.default_rng(seed=9)) print('best:', best)오류문 --------------------------------------------------------------------------- AllTrialsFailed Traceback (most recent call last) Cell In[21], line 4 1 from hyperopt import fmin, tpe, Trials 3 trial_val = Trials() ----> 4 best = fmin(fn=objective_func, 5 space=xgb_search_space, 6 algo=tpe.suggest, 7 max_evals=50, # 최대 반복 횟수를 지정합니다. 8 trials=trial_val, rstate=np.random.default_rng(seed=9)) 9 print('best:', best) File ~\anaconda3\envs\sklearn_env\lib\site-packages\hyperopt\fmin.py:540, in fmin(fn, space, algo, max_evals, timeout, loss_threshold, trials, rstate, allow_trials_fmin, pass_expr_memo_ctrl, catch_eval_exceptions, verbose, return_argmin, points_to_evaluate, max_queue_len, show_progressbar, early_stop_fn, trials_save_file) 537 fn = __objective_fmin_wrapper(fn) 539 if allow_trials_fmin and hasattr(trials, "fmin"): --> 540 return trials.fmin( 541 fn, 542 space, 543 algo=algo, 544 max_evals=max_evals, 545 timeout=timeout, 546 loss_threshold=loss_threshold, 547 max_queue_len=max_queue_len, 548 rstate=rstate, 549 pass_expr_memo_ctrl=pass_expr_memo_ctrl, 550 verbose=verbose, 551 catch_eval_exceptions=catch_eval_exceptions, 552 return_argmin=return_argmin, 553 show_progressbar=show_progressbar, 554 early_stop_fn=early_stop_fn, 555 trials_save_file=trials_save_file, 556 ) 558 if trials is None: 559 if os.path.exists(trials_save_file): File ~\anaconda3\envs\sklearn_env\lib\site-packages\hyperopt\base.py:671, in Trials.fmin(self, fn, space, algo, max_evals, timeout, loss_threshold, max_queue_len, rstate, verbose, pass_expr_memo_ctrl, catch_eval_exceptions, return_argmin, show_progressbar, early_stop_fn, trials_save_file) 666 # -- Stop-gap implementation! 667 # fmin should have been a Trials method in the first place 668 # but for now it's still sitting in another file. 669 from .fmin import fmin --> 671 return fmin( 672 fn, 673 space, 674 algo=algo, 675 max_evals=max_evals, 676 timeout=timeout, 677 loss_threshold=loss_threshold, 678 trials=self, 679 rstate=rstate, 680 verbose=verbose, 681 max_queue_len=max_queue_len, 682 allow_trials_fmin=False, # -- prevent recursion 683 pass_expr_memo_ctrl=pass_expr_memo_ctrl, 684 catch_eval_exceptions=catch_eval_exceptions, 685 return_argmin=return_argmin, 686 show_progressbar=show_progressbar, 687 early_stop_fn=early_stop_fn, 688 trials_save_file=trials_save_file, 689 ) File ~\anaconda3\envs\sklearn_env\lib\site-packages\hyperopt\fmin.py:593, in fmin(fn, space, algo, max_evals, timeout, loss_threshold, trials, rstate, allow_trials_fmin, pass_expr_memo_ctrl, catch_eval_exceptions, verbose, return_argmin, points_to_evaluate, max_queue_len, show_progressbar, early_stop_fn, trials_save_file) 589 if len(trials.trials) == 0: 590 raise Exception( 591 "There are no evaluation tasks, cannot return argmin of task losses." 592 ) --> 593 return trials.argmin 594 if len(trials) > 0: 595 # Only if there are some successful trail runs, return the best point in 596 # the evaluation space 597 return space_eval(space, trials.argmin) File ~\anaconda3\envs\sklearn_env\lib\site-packages\hyperopt\base.py:620, in Trials.argmin(self) 618 @property 619 def argmin(self): --> 620 best_trial = self.best_trial 621 vals = best_trial["misc"]["vals"] 622 # unpack the one-element lists to values 623 # and skip over the 0-element lists File ~\anaconda3\envs\sklearn_env\lib\site-packages\hyperopt\base.py:611, in Trials.best_trial(self) 605 candidates = [ 606 t 607 for t in self.trials 608 if t["result"]["status"] == STATUS_OK and not np.isnan(t["result"]["loss"]) 609 ] 610 if not candidates: --> 611 raise AllTrialsFailed 612 losses = [float(t["result"]["loss"]) for t in candidates] 613 if len(losses) == 0: AllTrialsFailed:
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
코랩으로 수업을 진행해도 괜찮은지 궁금합니다.
안녕하세요 강사님! 해당 강의에서 주피터로 코딩을 하는 것 같은데혹시 주피터노트북 대신 코랩으로 실습을 진행해도 문제 없을까요?
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
graphviz download
안녕하세요.현재 graphviz 버전이 12.2.1까지 나와있는데, 이 버전을 다운 받아도 문제 없이 수업 진행이 가능 한 건가요?
-
미해결OpenCV 강좌 - 컴퓨터 비전
안녕하세요 맥 cuda 관련해서 질문 올립니다.
안녕하세요 opencv 필요성을 느껴 찾게 되었습니다.제가 맥북프로 사용하고 있는데 cuda 설치가 안 되는데 설치 안해도 괜찮을까요??
-
미해결딥러닝 CNN 완벽 가이드 - TFKeras 버전
소프트맥스 관련 질문입니다
안녕하세요 선생님얼마전 머신러닝 완벽가이드 강좌에 소프트맥스 질문 드렸던 사람입니다.저는 소프트맥스 연산에 대한 하드웨어 가속기 설계 연구를 진행하고 있는 석사 과정생입니다.그 때 남겨주셨던 답변에 대해 답을 드리면, Softmax의 Input 정밀도라는 것은, 마지막 FC layer를 통과한 후, Softmax층의 input으로 들어가는 값에 몇 bit를 할당할 것이냐에 관한 내용입니다. 즉 제가 알고 싶은 내용을 다시 정리해보면 다음과 같습니다. softmax의 input (혹은 output도)에 많은 bit가 할당되면, H/W resource가 커지게 되므로, 모델의 accuracy를 크게 저해하지 않는 수준에서 어느 정도의 정밀도를 유지해야 하는지 알고 싶습니다. 하여 모델에서 softmax input 전에 따로 텐서 안의 값들을 특정 소수점 자리에서 반올림 해주는 함수를 정의해 반올림을 거치거나, 기존의 FP32를 FP16으로 casting을 거치도록 하여 좀 더 낮은 정밀도에서 잘 돌아가는 지 시뮬레이션을 해보는 중이었습니다. 저의 시뮬레이션 내용은 아래에 첨부하겠습니다. (rounding의 경우는 텐서 안의 값들이 제대로 반올림이 안된 것인지, 아니면 다른 이유가 있는 것인지.. 소수점 10번째에서 rounding을 하든, 20번째, 30번째에서 하든 accuracy에 큰 변화가 없고 거의 36프로 정도를 보였습니다.) 또 일반적으로 H/W설계 시에 floating point보다 fixed point가 구현이 훨씬 간단하며, 리소스 사용량이 매우 적은데, 소프트웨어적으로 모델을 학습시킬 때의 데이터는 대부분 float 32 또는 float 64를 이용하는 것 같습니다. 이는 역전파 과정에서 높은 정밀도가 필요하기 때문이 아닐까 싶은데, 모델 학습 시에 fixed point를 사용했을 때 발생할 수 있는 문제점이 있을까요 ? (소수점 10째자리에서 반올림을 하든, 20,30째자리에서 반올림을 하든 이론상으로는 정밀도가 높아질수록 accuracy가 높아져야 될 것 같은데 제 시뮬레이션 상으로는 모두 36프로의 정확도를 보여 코드에 문제가 있는 것인지, 아니면 알고리즘적으로 문제가 있는 것인지 궁금합니다.) 또한, FP16으로 표현 가능한 최대 정밀도의 값들이 훈련 시에 자주 사용되는지, 실제로 필요한 수준의 정밀도인지 궁금합니다. softmax 층의 input으로 들어가는 logit값(?)들의 range가 어느 정도인지도 궁금합니다. 아마 모델과 사용하는 데이터에 따라 크게 달라질 것 같기는 한데, 제가 읽었던 softmax accelerator관련 논문들에서는 일반적으로 softmax의 input의 range를 [-10,10]으로 가정을 했습니다. (알고리즘 분야가 아닌 하드웨어 논문들이기는 합니다..ㅠㅠ) 허나 실제 학습 시에 floating point를 사용한다는 것은 분명 logit값이 10보다 매우 큰 값이기 때문일 것 같은데 왜 논문들에서는 저런 범위를 가정했는지 궁금하여 든 생각이 혹시 practical한 모델 내에서는 softmax로 들어가기 전에 특정 범위 안으로 들어가도록 전 처리를 해주는 layer가 따로 있는 것인지 궁금했습니다. 또 학습이 점점 진행되면서 logit 값이 학습 후반부로 갈수록 일반적으로 수렴하는 분포(?)가 있는 것인지 궁금합니다.. (epoch별로 logit 값을 출력해보고 싶은데, 아직 코딩에 익숙치 않아 난항을 겪고 있습니다)본질적으로 softmax를 사용하는 이유가 궁금합니다.. multi classification에서 결국 하나의 class로 분류하는 것이 목적인데, 그러면 최종 logit값들 중 가장 큰 값을 선택하면 되는데 왜 굳이 softmax를 통해 확률 분포를 만든 후에 가장 높은 확률의 class로 선택하는지가 궁금합니다. (어차피 softmax를 취한 후의 maximum이나 취하기 전의 maximum이나 같을텐데)( 시뮬레이션 내용 ) 지난 번의 코드는 깃헙에서 임의로 가져온 코드라 조금 더 제대로 된 코드로 실습하고자 이번에는 선생님의 강의 자료인 VGG_Practice 실습 코드를 이용했습니다. 실습 코드의 모델 정의 부분에서 소프트 맥스 layer 직전에 rounding, 혹은 casting하는 부분을 추가한 것 외에 달라진 점은 없습니다.그림 1: float 16그림 2. float 16 결과그림 3. rounding (소수점 10째자리에서 반올림)그림 4. rounding 결과회로 설계 관련 연구를 진행하다 보니 AI 알고리즘에 대한 지식이 부족하여 다소 난해하게 질문드리게 된 점 정말 죄송합니다.. 또 하드웨어적 관점에서 생각하다보니 알고리즘 부분과는 다소 동떨어진 질문이 있을 수도 있을 것 같은데, 그런 부분이 있다면 죄송합니다 ㅠㅠ몇 년전, 동아리 활동을 하면서 머신러닝에 관심을 갖게 되어 선생님의 강의를 수강하고, 잘 공부했었던 기억이 있어 이렇게 다시 찾아 질문 드리게 되었습니다.긴 내용 읽어주셔서 감사드립니다..
-
해결됨ML/AI 엔지니어 면접 문항 총정리
엔트로피의 개념
안녕하세요 !주신 자료 너무 유익하게 잘보고 있습니다.공부하던중 질문한가지가 있습니다.Entropy의 개념인데요. 저는 Entorpy를 불확실성 uncertainty라고 이해하고 있었는데요.불확실성이 높을수록 high entropy를 보인다.예를들어 coin flip의 경우 앞뒤가 모두 0.5 probability를 가지고 있기때문에 결과에 대해서 불확실하기 때문에 high 엔트로피를 보인다라고 생각하고 있었는데요. 말씀해주신 정보량 측면에서 이해하고 답변하는게 더 좋을까요?관점이 좀 다른듯한데요. 어떤게 맞을지 문의드립니다.감사합니다.
-
미해결파이썬을 활용한 머신러닝 딥러닝 입문
MAtplotlib 기초
OOP style 부분에서 자꾸 name 'fig' is not defined라고 오류가 나는데 어떻게 해결하나요..?
-
해결됨실리콘밸리 엔지니어에게 배우는 파이썬 아파치 스파크
cdc 기반의 스트리밍 데이터 처리
안녕하세요. 강의 잘듣고 있는 도중에 질문이 있어 글을 작성하게 되었습니다. 현재 cdc 기반으로 iceberg 테이블에 operation(insert, update, delete) 정보들을 적용해서 데이터를 적재하고 있습니다. 이부분까지는 DMS -> kinesis -> lambda-> firehose -> iceberg 순서로 문제없이 적재를 진행하고 있지만 이런형식으로 운영중인 iceberg 테이블 10개를 join 시켜 datamart에 현재는 1주일에 한번씩 전체를 삭제 후 insert하는 비효율 적인 방식으로 마트를 운영중에 있습니다. 이것을 개선시키기 위해 적재중인 iceberg 테이블들에 변경된 데이터들을 5분 10분 단위로 종합해 datamart 테이블에 변경 분에 한해서만 insert, update, delete를 반영해주고자 하는데 강의를 듣다보니 spark streaming을 활용해서 뭔가 해결을 할 수 있을것 같은데 혹시 이부분에 대한 아이디어에 대해서 조언을 구할 수 있을까요? 10개의 테이블에 대해서 10분간 발생한 변경 점들을 종합해 datamart에 반영을 해주려고 하는데 아직 제대로 감이 잡히지 않아서 질문드렸습니다.
-
해결됨실리콘밸리 엔지니어에게 배우는 파이썬 아파치 스파크
broadcast 코드 예시 관련 질문
안녕하세요.broadcast 예제코드에서는 이미 aggregation된 dataframe(코드에서 interviwer_count)에 대해서 udf 실행을 위해서 meta 딕셔너리를 broadcast한 다음에 udf를 실행하는 것으로 이해하였는데요.실제 운영하는 상황에서는 이런 경우에는 이미 aggregation이 된 dataframe이 먼저 만들어질 것이기 때문에 meta 딕셔너리를 dataframe으로 만든 후 join하는 것과 큰 차이가 없지 않나요?해당 코드에서 broadcast를 함으로써 다른 방법(join 등)에 비해 얻는 이점이 어떤 건지 궁금합니다.
-
미해결파이썬으로 시작하는 머신러닝+딥러닝(sklearn을 이용한 머신러닝부터 TensorFlow, Keras를 이용한 딥러닝 개발까지)
안내해주신 어떤 곳에도 보스턴 집값 예측 csv파일을 찾을 수 없습니다.
안내해주신 어떤 곳에도 보스턴 집값 예측 csv파일을 찾을 수 없습니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
corr()이 작동하지 않는 문제
안녕하세요. 먼저 좋은 강의 감사드립니다.저는 이번 9회 시험에서 1유형 30점, 2유형 40점, 3유형 20점 총 90점으로 합격했습니다. 퇴근후딴짓 선생님의 좋은 강의 덕분이라고 생각합니다. 다만 시험 중에 이상한 일이 있었습니다.이번 3유형에 상관계수를 구하는 문제가 있었는데요, 제가 시험장에서 corr() 메서드를 사용했을 때 작동하지 않았습니다.자료형이 틀렸거나 옵션 문제 등의 오류가 아니라, 확실히 not defined로 기억합니다. corr() 메서드 호출 자체가 불가능했습니다. 몹시 당황해서 이런저런 라이브러리를 불러도 보고, dir, help 등도 시도해봤지만 호출 자체가 안 되니 할 수 있는 방법이 없더라고요.마지막으로 통계학 지식을 동원해 수작업 계산을 시도했지만, 결국 시간 부족으로 corr()이 필요했던 두 문제를(각 5점) 틀리게 되었습니다. 혹시 이런 문제가 발생하는 경우에 대해 아시는 바가 있을까요?합격과는 별개로 너무 궁금하고 답답해서 문의를 드립니다.
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
합격 소식과 함께 궁금한 점 문의드립니다.
선생님 안녕하세요. 우선 오늘 최종 합격하여 소식을 전하게 되었습니다.다만, 다름이 아니라 점수가 좀 턱걸이인지라.. 담주에 예정된 최종 결과에서 합격예정이 불합격으로 바뀌는 사례가 있는지 궁금합니다. 제가 알기로는 불합격 사례에서 합격 한 사례는 있는 것으로 아는데 반대 사례가 있는지요??우선 정말 감사드립니다. 큰 도움이 되었습니다.
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
수강 연장 문의
선생님 안녕하세요!이번 9회 시험을 55점으로 떨어지게 되어서.. 내년 6월에 있는 10회 시험을 응시하려고 합니다 ㅠㅠ그런데 만료 기간이 내년 5월까지라, 한 달 정도 강의를 일시정지하거나 다음 회차 시험 때까지 강의를 연장할 수 있을까요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
강사님 감사드립니다.
금일 빅분기 실기 가체점 결과가 올라와서 확인했는데...합격했습니다. 1교시가 너무 어렵게 나와서 힘들었었는데...강사님이 시험전에 2교시->3교시->1교시 순으로 준비를 하라는 글을 보고 많이 도움이 됐습니다. 덕분에 2차시험 2번째에 합격해서 감사드립니다. 회사일 때문에 강사님이 올려주신강의와 모의고사 풀이를 4번이상 반복해서 풀어본거, 마이드 맵을 기반으로 리마인드 해본 것이 많이 도움 됐습니다. 감사합니다.~~
-
미해결실리콘밸리 엔지니어에게 배우는 파이썬 아파치 스파크
재생에 문제가 생겼어요 라는 메세지가 자꾸 뜨네요
질문은 많으시면 많을수록 좋습니다. 가능한 빠른 답변 드리겠습니다.원활한 답변을 위해, 자세한 질문 사항 부탁드려요 :D
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
Softmax 관련 질문입니다.
안녕하세요. 선생님의 강의로 머신러닝 및 딥러닝에 관심을 갖게 되었습니다.다름이 아니고, CIFAR100 dataset에 대해서 VGGNet이라는 모델을 이용해 훈련을 시켜보고 있는데,제가 궁금한 것은 Softmax의 Input의 정밀도를 어디까지 유지하면 모델이 잘 학습될 수 있을까?입니다. 아래의 코드는 training부분입니다. 첫 번째 사진처럼 모델을 훈련시키는데, model(images)를 통해 나온 실제 output을 이용하면 모델이 잘 학습이 되는데 (마지막 epoch의 validation accuracy 55, Top-5 Test Accuracy 80%정도), 이 output을 rounding을 하면 소숫점 아래 20째자리까지 반올림을 해서 높은 정밀도를 유지해도 모델 학습이 아예 되지 않는 (모든 epoch가 끝나도 Validation Accuracy가 1%남짓) 문제가 발생합니다. 이러한 문제가 왜 발생하는지, 어떻게 하면 해결할 수 있을지또 제가 궁금한 Softmax layer에서 요구하는 최소 Input 정밀도에 대해 다른 방법으로 측정할 수 있을지 궁금합니다 ㅠㅠ감사합니다
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
5-2type2.ipynb 질문 (작업형2 모의문제2)
강의 에서 예측진행시 선형회귀 랏소 릿지의 경우model= 하고 뒤에 해당 모델을 작성했는데18분 22초 랜덤포레스트의 경우 regressor =RandomForestRegressor()로 정의해 놓고밑에 학습은 model.fit으로 하고 pred도 model.fit으로 했는데 그럼 위에 있는 라쏘를 가지고 모델링을 한게 아닌가 궁금합니다.※요약 1: 랜덤포레스트에는 모델로 안하고 왜 regressor = 으로해서 진행했는가,요약2: model.fit으로 진행했는데, import를 랜덤포레스트로 했음에도 , 랜덤포레스트가 아닌 위에 model을 정의한 라쏘로 학습이 된것 아닌가이렇게 궁금합니다!!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
2유형 test_size 질문드립니다
안녕하세요 저번 달에 실기시험 보고 온 수강생입니다. 평소에는 train_test_split에서 test_size를 0.2로 했는데시험장에서 무슨 바람이 분 건지 test_size를 0.1로 하고 왔습니다.이것 때문에 점수가 10점이 깎일 수도 있을까요?이외에는 랜덤포레스트 분류 모델 정석 코드 그대로 실행, 제출하고 왔습니다.2유형만 40점 나오면 넉넉하게 합격일 것 같은데 괜히 불안해지네요..
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
필기 과정을 다시 준비해야합니다..ㅠㅠ
직장을 다니면서 자격증 시험을 준비했는데, 하필 실기 시험날 타 지역 출장이 있어 응시를 하지 못했습니다..ㅠㅠ 일 하면서 틈틈히 강의 듣고 했는데 너무 아쉽네요 ㅎ 지금 필기 유효기간도 만료되어서 내년에 다시 준비를 해야하는데, 실기 강의가 내년 5월 만료더라구요 . 혹시 필기 대비하는 강좌나 25년 대비 강좌를 계획중이신게 있으실까요? 있다면 패키지로 묶어서 구매하고 싶은데, 기존 수강생 할인이나 쿠폰같은게 있으면 좋을 것 같아서요 .(양심이 없어 죄송합니다ㅠㅠ) 그리고 필기 공부하면서 실기를 같이 병행(실기강좌중 개념을 다루는 부분)하는게 좋은지도 궁금합니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
아나콘다 설치 실패
안녕하세요. 시험결과를 기다리는 동안 아나콘다를 사용해서 추가적으로 파이썬을 연습해 볼까 하고 있습니다만, 아나콘다 설치 실패가 나와서 혹시 이부분도 도움을 받을 수 있을까 하여 글을 남겨 봅니다.추가적으로 말씀드리자면 사용자 파일에 있는 anaconda3파일을 휴지통에 넣었는데도 같은 에러가 발생하고 있습니다. 그리고 터미널을 통해서 rmdir을 통해서 파일을 지우려고 시도해봤는데도 잘 되지 않습니다. 저는 파이썬과 터미널 완전 입문자 입니다. 이것저것 해봐도 안되서 도움을 요청드립니다. (저는 mac유저 입니다) 요