묻고 답해요
130만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결[비전공자 대환영] 캐글 데이터를 활용한 Optuna with MLFlow - 캐글다지기
ImportError: cannot import name 'plot_roc_curve
로지스틱 모형 개발 with MLFLow의 lecture_01_classification_titanic_mlflow.ipynb 에서 ImportError: cannot import name 'plot_roc_curve' from 'sklearn.metrics' (C:\Users\user\anaconda3\lib\site-packages\sklearn\metrics\__init__.py) 위와 같은 오류가 납니다.아마도 버전 때문인 것 같습니다만, 현재 sklearn version: 1.2.1 입니다. RocCurveDisplay 임포트 하고 roc_plot = plot_roc_curve(ml_model, X_test, y_test, name="Scikit-Learn ROC Curve")roc_plot = RocCurveDisplay(ml_model, X_test, y_test, name="Scikit-Learn ROC Curve")이 부분을 name="Scikit-Learn ROC Curve" 어떻게 변경해야 하는지요? 답변 부탁드립니다. 감사합니다.
-
미해결딥러닝 CNN 완벽 가이드 - Fundamental 편
val_loss값이 계속 커지는 현상이 왜 나오나요?
안녕하세요.코드를 타이핑하며 실행해 보는데, 강의 화면과는 달리 vla_loss값이 점점 커지는 결과가 나왔습니다.처음에는 제가 타이핑을 잘못해서 그런가 했는데, 선생님이 제공해주신 코드를 그대로 실행해도 비슷한 결과가 나왔습니다.여러 번 런타임을 재실행하고 해봐도 마찬가지입니다.왜 이런 현상이 나타나나요?(kaggle에서 실행했습니다)
-
해결됨처음하는 파이썬 머신러닝 부트캠프 (쉽게! 실제 문제로 개념/활용 익히기) [데이터과학 Part2]
하이퍼 파라미터 튜닝 기법 적용하기1(XGBoost 실습) 강의에서 질문입니다
하이퍼 파라미터 튜닝 기법 적용하기1(XGBoost 실습) 강의에서 질문입니다.해당 강의 7:28 부근에서 pbounds에 들어간 하이퍼 파라미터에 대해 설명을 해주셨는데요,pbounds = { 'learning_rate': (0.01, 0.5), 'n_estimators': (100, 1000), 'max_depth': (3, 10), 'min_child_weight': (0, 10), 'subsample': (0.5, 1.0), 'colsample_bytree': (0.5, 1.0), 'gamma': (0, 5) # 'reg_lambda': (0, 1000, 'log-uniform'), # 'reg_alpha': (0, 1.0, 'log-uniform') }아래에 있는 reg_Lambda와 reg_alpha는 왜 주석 처리를 하고, 사용하지 않았는지 궁금합니다!
-
미해결딥러닝 CNN 완벽 가이드 - Fundamental 편
저장된 모델에는 무엇이 들어 있나요? 그리고 weight만 저장했을 경우 어떻게 사용하나요?
매개변수를 하나하나 알기 쉽게 설명해주셔서 감사합니다. [질문 1] fit 중에 콜백함수를 이용해 모델을 저장할 수 있다고 하셨는데요, 모델 안에 무엇이 저장되는지 궁금합니다. loss, accuracy, weights 는 저장되어 있을 것 같은데요, 그 외에 무엇이 저장되어 있나요? 혹시 학습 데이터도 저장되나요? 저장 목록을 알려면 어떤 명령어를 써야 하나요? [질문 2] fit 중에 오류가 발생해 다운되었을 때, 저장된 모델을 불러 fit을 이어서 할 수 있나요? [질문 3] save_weights_only 했을 경우 어떻게 사용해야 하나요? 저장된 모델을 불러 바로 predict 하면 되나요? 모델을 저장하고 불러 와 사용한 적이 없다보니 질문 범위가 너무 넓은 것 같아 죄송합니다. 혹시 참고할 만한 사이트를 알려주시면 공부해보겠습니다.
-
미해결딥러닝 CNN 완벽 가이드 - Fundamental 편
Upstream Gradient, Local Gradient의 의미를 제대로 이해했는지 몰라서요.
안녕하세요. Upstream Gradient와 Local Gradient를 제대로 이해했는지 몰라 질문드립니다.세터1의 가중치를 업데이트하려고 할 때Local Gradient는 구하고자 하는 가중치(세터1)가 직접 곱해지는 레이어의 gradient를 가리키는 것이고Upstream Gradient는 세터1이 직접 곱해지는 레이어 이전까지(역방항기준) 모든 레이어의 gradient를 가리키는 것이 맞나요? 상세하고 명쾌한 강의 감사드립니다.
-
해결됨딥러닝 CNN 완벽 가이드 - Fundamental 편
Sigmoid 함수의 특성
안녕하세요 교수님!섹션 2의 딥러닝 모델에서 활성화 함수의 적용 강의에서 의문점이 생겨서 작성합니다.Sigmoid 함수의 특성에서 평균값이 0.5, 즉 0이 아니라서 Gradient Update가 지그재그 형태로 발생한다고 하셨는데.. 이 부분이 이해가 잘 되지 않습니다.입력값의 크기가 양으로 크거나 음으로 클 때 기울기가 0에 가까워서 Gradient Update가 적어진다는 것은 알겠습니다. 하지만 입력값을 넣었을 때의 시그모이드 출력값의 평균과 Gradient Update가 어떤 관계인지가 이해가 되지 않습니다ㅜ시그모이드를 미분한 함수가 시그모이드 출력값을 입력값으로 넣는게 아닌데... 왜 지그재그로 발생하는 것인가요.....?감사합니다!
-
미해결캐글 Advanced 머신러닝 실전 박치기
타겟값의 로그변환에 대해서
선생님 안녕하세요 머신러닝강의(2개)와 컴터비젼강의를 듣고 있는 회사원입니다 ㅎ이번에 머신러닝강의중 타겟값(5개, 정수형태)의 로그변환에 대해서 조언을 받고싶어서 질문을 드립니다 ㅎ바쁘시겟지만 조언 좀 부탁드리겟습니다선생님 강의내용대로 예를들어, 아래와같은 5개타겟값(양수값)이 있을때, 이를 로그변환한 후 이값을 머신러닝으로 예측해서 로그값끼리 단순오차를 비교하면 평균오차2%대, 최대오차 4%대로 아주 좋은 결과가 나옵니다 ㅎ근데. 로그를 벗기고 실제값(양수값)과 예측값(양수값)로 비교하면 평균오차는 4%대, 최대오차는 13%대로 최대오차에서 로그값과 비교하면 3배이상이 차이가 납니다ㅎ여기서 조언을 듣고싶은것이, 실제값(양수형태)과 예측값(양수형태)의 비교에서 최대오차 혹은 평균오차를 더 작게 할수 잇는 방법이 있는지요?예를들어, 최대오차가 크게 발생하는 실제값을 알아보고, 그값의 예측값에 가중치를 부여한다던지....혹시 가능하시다면 코드도 넣어서 답변 부탁드리겠습니다 ㅎ바쁘시겟지만 부탁드리겠습니다 ㅎ-----------------------------------------------------------##<참고>예를들어, 타겟값[1, 10, 100, 10000, 100000]일때##<로그값끼리 5개값의 단순오차비교하면> abs(log(y)-log(y_pred))/log(y)*1005개평균오차 : 2%대5개중 최대오차 : 4%대##<로그를 벗기고, 실제값과 예측값비교하면> abs(y-y_pred))/y*1005개평균오차 ; 4%대5개중 최대오차 ; 13%대 바쁘시겟지만, 시간나실때 답변 부탁드리겠습니다 ㅎ
-
미해결딥러닝 CNN 완벽 가이드 - Fundamental 편
안녕하세요 교수님 alexnet 구현중에 질문 있습니다.
논문에서 가중치 초기화를 할때, 평균은 0 이고 표준편차가 0.01이라고 하였는데 위와 같이 구현했는데, 성능이 너무 좋지 않아서요.혹시 잘못된것이 있을까요?
-
해결됨처음하는 파이썬 머신러닝 부트캠프 (쉽게! 실제 문제로 개념/활용 익히기) [데이터과학 Part2]
우도, 사후 확률 예제에 질문 있습니다
안녕하세요. 우도는 P(필기체 0 | 0) 으로 표기하고사후 확률은 P(0 | 필기체 0) 이라고 말씀 하셨는데요. 머신러닝으로 학습한 모델이 추론할 때는, 필기체0(원인)을 보고 이것이 0인지 판단(결과) 하므로,우도: P(0 | 필기체 0)사후 확률: P(필기체 0 | 0)이 되어야 하지 않는지 질문 드립니다.
-
미해결딥러닝 CNN 완벽 가이드 - Fundamental 편
안녕하세요 1*1 conv 강의 동영상 13분45초에 질문있습니다.
교수님께서는 연산량을 5*5*200*30*30*64라고 하셨습니다.하지만 convolution을 적용한 feature map은 입력의 크기와 같으니 padding을 적용한것이라고 볼수있습니다.그러니 padding은 입력 사이즈의 가로 세로 2를 더하고, 입력 feature는 총 34*34*200의 크기를 가지게 될것입니다.결국에는 34*34*200*5*5*200*64가 총 연산량이라고 생각됩니다.
-
미해결딥러닝 CNN 완벽 가이드 - Fundamental 편
CNN에 대한 질문이 있습니다.
안녕하세요 교수님CNN에 대해 궁금한 점이 있어 질문 남깁니다.CNN으로 이미지 분류를 수행할 때, 인풋데이터로 이미지가 아닌 수치형 데이터를 넣어도 분류가 가능한가요?예를 들면, 수치형 데이터의 색을 부여한 후,(0이면 흰색에 가깝게, 100이면 검은색에 가깝게) 색을 부여한 이미지로 분류를 수행하는 것이 가능한 건가요?위에서 말하는 색 이미지를 파이썬 코드로 대체하여 출력을 하지 않고도(따로 인풋 데이터로 이미지를 제공하지 않아도) CNN의 이미지 분류가 가능한 것인지 궁금합니다.
-
미해결딥러닝 CNN 완벽 가이드 - Fundamental 편
model.evaluation 진행시 loss 문의
안녕하세요.유익한 강의 항상 감사합니다.모델을 Train/Vaild 한 후, 낮은 Loss값(0에 가까운)과 높은 Accuracy 값이 나와서 Train이 잘 되었구나 라고 생각했는데요.model.evaluation을 진행해보니 생각보다 높은 Loss와 상대적으로 Train때 보다 낮은 Accuracy가 나왔습니다.108/108 [==============================] - 15s 134ms/step - loss: 2.5198 - accuracy: 0.7227loss가 저렇게 높을 수도 있나요? Train 진행시 첫번째 Epoch에서도 loss가 높듯이 model.evaluation 첫번째 epoch(?)에서도 loss가 높은걸까요? 감사합니다.
-
해결됨딥러닝 CNN 완벽 가이드 - Fundamental 편
안녕하세요 교수님. 커스텀 데이터 로더 만들기에서 질문 있습니다.
교수님께서 작성하신 커스템 데이터로더를 이해하고 있는데요.이 코드를 아무리 실행해도, label의 값이 CAT이 나오지 않습니다.next가 다음 batchSize만큼 가져오는것이라고 생각했는데, 왜 아무리 실행해도 계속 같은 값이 나올까요?만약 인덱스 값을 빼게 되면 이미지의 픽셀값이 다르게 나오는것을 확인할수있었습니다.
-
해결됨딥러닝 CNN 완벽 가이드 - Fundamental 편
안녕하세요 교수님 코드 부분 질문있습니다.
show_pixel_histogram(images_array[0])값이 실행할때마다 항상 다른 히스토그램을 보여주고있습니다.실행할때마다 batch_size만큼 다음 batch로 넘어가기 때문에 히스토그램 값이 달라지는것이 맞는지 여쭤보고 싶습니다.
-
미해결딥러닝 CNN 완벽 가이드 - Fundamental 편
흑백 이미지 데이터 셋에 관련된 질문입니다.
안녕하세요. 선생님정말 질 좋은 강의를 들을 수 있어서 행운이라고 생각합니다. CatnDog_Sequence기반으로 개인적으로 Modify하여 공부를 해보고 있습니다.제가 갖고 있는 이미지는 흑백 이미지 인데요.image = cv2.imread("D:\\Lens_image_data\\test\\test_set\\sort1\\1.BMP", cv2.IMREAD_ANYCOLOR) print(image.shape)shape을 print해보았을 때, (1548, 1544)으로 RGB 3채널이 아닌 것도 확인하였습니다.1) 따라서 Image_Batch 배열 진행 시에도 뒤에 3채널은 빼고 넣었으며,image_batch = np.zeros((image_name_batch.shape[0], IMAGE_SIZE, IMAGE_SIZE), dtype='float32')2) 이미지를 cv2로 읽어올 때도 아래와 같이 변경해보았습니다.image = cv2.imread(image_name_batch[image_index], cv2.IMREAD_UNCHANGED)이렇게 되면 shape이 (64, 224, 224) (64,) 이렇게 나오는데, 흑백 이미지로 할 때는 상기와 같이 바꾸는게 맞는 것인지 궁금합니다.
-
해결됨딥러닝 CNN 완벽 가이드 - Fundamental 편
안녕하세요 교수님 CIFAR10의 픽셀 크기에 대해서 질문있습니다.
강의 1분 20초에 IMAGE_SIZE = 32로 설정하여 Feature Extractor의 마지막 layer의 크기가 (1,1,512)가 나와 학습이 원할하게 잘 안된다고 하셨습니다.그래서 IMAGE_SIZE를 64로 설정하셨는데, CIFAR10의 픽셀개수를 강제로 64개로 바꿔주면 화질이 더 안좋다고 하셨는데,저의 생각은 픽셀개수가 더 많아짐으로 화질이 더 좋은것이 아닌가 라는 생각이 들었습니다. 혹시 Interpolation 때문에 화질이 더 안좋아진다고 생각해도 될까요?
-
해결됨딥러닝 CNN 완벽 가이드 - Fundamental 편
안녕하세요 교수님. shift에 관해서 질문있습니다.
width_shift와 height_shift가 서로 반대로 실행이되는거같습니다.혹시 단순한 오류인걸까요?
-
해결됨딥러닝 CNN 완벽 가이드 - Fundamental 편
안녕하세요 교수님. 배치정규화 가중치 개수에 대해 질문있습니다.
혹시 배치정규화의 가중치 개수는 어떻게 구하는지 알수있을까요?chat gpt와 블로그를 봤는데도 설명이 나와있지 않아서 여쭤봅니다 !
-
미해결딥러닝 CNN 완벽 가이드 - Fundamental 편
테스트 데이터 적용시 BN에 대해서 질문있습니다.
학습된 모델을 이용해서 1개의 test data를 추론하는 과정에서 BN이 적용이 안되기 때문에,학습데이터를 통해 구해진 평균과 표준편차를 이용해서 1개의 test data를 BN시켜주는것이 맞나요??(지수가중평균이동을 이용해서)r(scaling)과 b(shift)는 학습 데이터에서 최적화 된 값을 이용하는것이고요!!제가 정확히 이해한건지 확인차 질문드립니다!!
-
미해결캐글 Advanced 머신러닝 실전 박치기
아나콘다 환경설정
안녕하세요 선생님실습환경 구축이 너무 어려운데 pc 메모리가 16gb 이면그냥 주피터노트북으로 실행해도 무관할까요?