묻고 답해요
130만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결차량 번호판 인식 프로젝트와 TensorFlow로 배우는 딥러닝 영상인식 올인원
Neural Style Transfer 강의자료 공유
Neural Style Transfer에 해당되는 강의자료 공유 부탁드립니다. 감사합니다. tae.park0302@gmaili.com
-
미해결딥러닝 CNN 완벽 가이드 - Fundamental 편
안녕하세요 교수님 alexnet 구현중에 질문 있습니다.
논문에서 가중치 초기화를 할때, 평균은 0 이고 표준편차가 0.01이라고 하였는데 위와 같이 구현했는데, 성능이 너무 좋지 않아서요.혹시 잘못된것이 있을까요?
-
미해결딥러닝 CNN 완벽 가이드 - Fundamental 편
안녕하세요 1*1 conv 강의 동영상 13분45초에 질문있습니다.
교수님께서는 연산량을 5*5*200*30*30*64라고 하셨습니다.하지만 convolution을 적용한 feature map은 입력의 크기와 같으니 padding을 적용한것이라고 볼수있습니다.그러니 padding은 입력 사이즈의 가로 세로 2를 더하고, 입력 feature는 총 34*34*200의 크기를 가지게 될것입니다.결국에는 34*34*200*5*5*200*64가 총 연산량이라고 생각됩니다.
-
미해결설계독학맛비's 실전 AI HW 설계를 위한 바이블, CNN 연산 완전정복 (Verilog HDL + FPGA 를 이용한 가속기 실습)
Serial terminal 무응답
안녕하세요 Lab3 실습을 진행했습니다.이 과정에서 동일하게 했음에도 불구하고 Vitis에서 진행했을때 Vitis Serial Terminal이 무응답입니다.Digilent driver도 설치하고 Vivado driver도 설치해보고 Vivado자체를 최신버전 2023.1로 설치를 해보아도 시리얼 통신이 안됩니다ㅠㅠ그리고 Vitis에서 Launch Hardware를 하면 FPGA보드의 DONE LED가 동시에 켜집니다..또한 Launch Hardware를 실행시킬때 두번에 한번씩은 'could not find fpga device on the board for connection 'local' '라는 오류가 뜹니다..이에 대한 해결법으로 구글링해서 드라이버 설치하라는거 다 해봤는데도 안되네요ㅠㅠ뭐가 문제일까요.이번 실습 뿐 아니라 모든 실습 + 제 프로젝트까지도 무응답입니다..ㅜㅜ
-
미해결딥러닝 CNN 완벽 가이드 - Fundamental 편
CNN에 대한 질문이 있습니다.
안녕하세요 교수님CNN에 대해 궁금한 점이 있어 질문 남깁니다.CNN으로 이미지 분류를 수행할 때, 인풋데이터로 이미지가 아닌 수치형 데이터를 넣어도 분류가 가능한가요?예를 들면, 수치형 데이터의 색을 부여한 후,(0이면 흰색에 가깝게, 100이면 검은색에 가깝게) 색을 부여한 이미지로 분류를 수행하는 것이 가능한 건가요?위에서 말하는 색 이미지를 파이썬 코드로 대체하여 출력을 하지 않고도(따로 인풋 데이터로 이미지를 제공하지 않아도) CNN의 이미지 분류가 가능한 것인지 궁금합니다.
-
미해결딥러닝 CNN 완벽 가이드 - Fundamental 편
model.evaluation 진행시 loss 문의
안녕하세요.유익한 강의 항상 감사합니다.모델을 Train/Vaild 한 후, 낮은 Loss값(0에 가까운)과 높은 Accuracy 값이 나와서 Train이 잘 되었구나 라고 생각했는데요.model.evaluation을 진행해보니 생각보다 높은 Loss와 상대적으로 Train때 보다 낮은 Accuracy가 나왔습니다.108/108 [==============================] - 15s 134ms/step - loss: 2.5198 - accuracy: 0.7227loss가 저렇게 높을 수도 있나요? Train 진행시 첫번째 Epoch에서도 loss가 높듯이 model.evaluation 첫번째 epoch(?)에서도 loss가 높은걸까요? 감사합니다.
-
해결됨딥러닝 CNN 완벽 가이드 - Fundamental 편
안녕하세요 교수님. 커스텀 데이터 로더 만들기에서 질문 있습니다.
교수님께서 작성하신 커스템 데이터로더를 이해하고 있는데요.이 코드를 아무리 실행해도, label의 값이 CAT이 나오지 않습니다.next가 다음 batchSize만큼 가져오는것이라고 생각했는데, 왜 아무리 실행해도 계속 같은 값이 나올까요?만약 인덱스 값을 빼게 되면 이미지의 픽셀값이 다르게 나오는것을 확인할수있었습니다.
-
해결됨딥러닝 CNN 완벽 가이드 - Fundamental 편
안녕하세요 교수님 코드 부분 질문있습니다.
show_pixel_histogram(images_array[0])값이 실행할때마다 항상 다른 히스토그램을 보여주고있습니다.실행할때마다 batch_size만큼 다음 batch로 넘어가기 때문에 히스토그램 값이 달라지는것이 맞는지 여쭤보고 싶습니다.
-
미해결딥러닝 CNN 완벽 가이드 - Fundamental 편
흑백 이미지 데이터 셋에 관련된 질문입니다.
안녕하세요. 선생님정말 질 좋은 강의를 들을 수 있어서 행운이라고 생각합니다. CatnDog_Sequence기반으로 개인적으로 Modify하여 공부를 해보고 있습니다.제가 갖고 있는 이미지는 흑백 이미지 인데요.image = cv2.imread("D:\\Lens_image_data\\test\\test_set\\sort1\\1.BMP", cv2.IMREAD_ANYCOLOR) print(image.shape)shape을 print해보았을 때, (1548, 1544)으로 RGB 3채널이 아닌 것도 확인하였습니다.1) 따라서 Image_Batch 배열 진행 시에도 뒤에 3채널은 빼고 넣었으며,image_batch = np.zeros((image_name_batch.shape[0], IMAGE_SIZE, IMAGE_SIZE), dtype='float32')2) 이미지를 cv2로 읽어올 때도 아래와 같이 변경해보았습니다.image = cv2.imread(image_name_batch[image_index], cv2.IMREAD_UNCHANGED)이렇게 되면 shape이 (64, 224, 224) (64,) 이렇게 나오는데, 흑백 이미지로 할 때는 상기와 같이 바꾸는게 맞는 것인지 궁금합니다.
-
해결됨딥러닝 CNN 완벽 가이드 - Fundamental 편
안녕하세요 교수님 CIFAR10의 픽셀 크기에 대해서 질문있습니다.
강의 1분 20초에 IMAGE_SIZE = 32로 설정하여 Feature Extractor의 마지막 layer의 크기가 (1,1,512)가 나와 학습이 원할하게 잘 안된다고 하셨습니다.그래서 IMAGE_SIZE를 64로 설정하셨는데, CIFAR10의 픽셀개수를 강제로 64개로 바꿔주면 화질이 더 안좋다고 하셨는데,저의 생각은 픽셀개수가 더 많아짐으로 화질이 더 좋은것이 아닌가 라는 생각이 들었습니다. 혹시 Interpolation 때문에 화질이 더 안좋아진다고 생각해도 될까요?
-
해결됨딥러닝 CNN 완벽 가이드 - Fundamental 편
안녕하세요 교수님. shift에 관해서 질문있습니다.
width_shift와 height_shift가 서로 반대로 실행이되는거같습니다.혹시 단순한 오류인걸까요?
-
해결됨딥러닝 CNN 완벽 가이드 - Fundamental 편
안녕하세요 교수님. 배치정규화 가중치 개수에 대해 질문있습니다.
혹시 배치정규화의 가중치 개수는 어떻게 구하는지 알수있을까요?chat gpt와 블로그를 봤는데도 설명이 나와있지 않아서 여쭤봅니다 !
-
미해결딥러닝 CNN 완벽 가이드 - Fundamental 편
테스트 데이터 적용시 BN에 대해서 질문있습니다.
학습된 모델을 이용해서 1개의 test data를 추론하는 과정에서 BN이 적용이 안되기 때문에,학습데이터를 통해 구해진 평균과 표준편차를 이용해서 1개의 test data를 BN시켜주는것이 맞나요??(지수가중평균이동을 이용해서)r(scaling)과 b(shift)는 학습 데이터에서 최적화 된 값을 이용하는것이고요!!제가 정확히 이해한건지 확인차 질문드립니다!!
-
미해결딥러닝 CNN 완벽 가이드 - Fundamental 편
Code 에러 도와 주십시오.
안녕하세요 선생님첫 예제인 Gradient_Descent_Pra...을 시험 해보려고 Kaggle에 입력 하였는데 위 그럼 같은 에러가 나옵니다.제가 보기에는 버전이 안 맞은것 같은데요, 확인 부탁 드립니다.
-
미해결차량 번호판 인식 프로젝트와 TensorFlow로 배우는 딥러닝 영상인식 올인원
Object Detection (fasterrcnn) 공지해주신 소스의 오류 수정 부탁드립니다.
안녕하세요일전에 공지해주신 아래 파일에서 에러가 나는데 수정 좀 부탁 드립니다.1강_TF2_Detection_Model_ZOO_example_fasterrcnn_pedestrian_dataset_2022_11_11.ipynbhttps://colab.research.google.com/drive/1LIMGUFJtCWw3gdgWh3T2aorR4AwogyPS?usp=sharing 죄송합니만 개인 사정상 다소 급하오니 선처 부탁드립니다!
-
미해결딥러닝 CNN 완벽 가이드 - Fundamental 편
안녕하세요 교수님. fit()과 모델 생성할때 input 질문있습니다.
안녕하세요 교수님. model을 생성할때는 입력값을 만약 2차원 gray scale (크기 = 28 28)이 들어왔다면 tensor값을 받아야하니 이것을 3차원(1 28 * 28)으로 받는것을 이해했습니다.만약 RGB 이미지라면 (크기 : 28 28 3 )이 값을 그대로 받는건가요?? channel값은 임의의로 정했습니다.그렇다면 fit()함수는 x값과 y값은 numpy로 받는데 이 값을 numpy에서 tensor값으로 변경시켜주지않고 받는것일까요?? 궁금합니다
-
미해결딥러닝 CNN 완벽 가이드 - Fundamental 편
선생님, 강의자료 ppt는 어디서 받나요?
선생님, 강의자료 ppt 얻을 수 있나요?감사합니다.
-
미해결차량 번호판 인식 프로젝트와 TensorFlow로 배우는 딥러닝 영상인식 올인원
craft와 crnn의 사이 연결관계에 대해서
craft에서 여러글자를 하나의 단어로 인식하는것이 맞는 것인가요 번호판 커스텀 데이터를 보면 bbox 와 하나의 라벨링이 있는데 해당 라벨링에 여러 단어가 들어가있습니다. 그래서 추측하기에 원래 기본적으로 하나의 단에 하나의 bbox가 있는것인데 이번 강의에서 여러 단어를 하나의 단어로 인식하는 방식이 맞는 것인지 궁금합니다. 아니면 라벨링은 무시하는 데이터 입니까?아니면 craft가 문자 인식에 탁월한 detection model이지만, 이를 글자가 아니라 애초에 번호판 박스를 인식하는데에 쓰는 것인가요?그리고 해당 bbox를 통해 전체 이미지중 해당 되는 img를 잘라서 crnn이 받아서 글자를 recognize 하는 것이 맞는것 인지 궁금합니다
-
미해결딥러닝 CNN 완벽 가이드 - Fundamental 편
Graph execution error: 에러
선생님 안녕하세요. 다른 데이터셋으로 alexnet 모델훈련 후 test데이터 셋으로 성능 평가 중 해당에러가 발생하는데 버전문제일까요? 캐글노트북에서 진행하고 있습니다.UnknownError: Graph execution error:
-
미해결딥러닝 CNN 완벽 가이드 - Fundamental 편
kenel_size부분 질문이요!
input_tensor = Input(shape = (IMAGE_SIZE, IMAGE_SIZE, 3)) x = Conv2D(filters = 32, kernel_size = (3, 3), padding = 'same', activation = 'relu', kernel_initializer = 'he_normal')(input_tensor)이 부분에서 입력데이터가 3차원으로 들어오잖아요.저번 강의에서 개별 커널의 차원은 3차원이라고 하셨던거 같은데,그럼 이 코드에선 한개의 커널이 rgb, 총 3개의 채널을 가진 (3 x 3 x 3)가 되는 것인가요?위에 전제가 맞다면, 2번째 줄 kernel_size가 (3, 3)인 이유는 케라스 내부에서 알아서 3개의 채널을 만들어주기 때문인가요??