묻고 답해요
156만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
안녕하세요 강사님, RPN 힉습관련하여 질문드립니다.
안녕하세요 강사님. 수업 항상 잘 듣고있습니다. 바쁘시겠지만.. detection 학습관련하여 계속 헷갈리는 부분 있어서.. 질문드립니다. 이번 강의 중간 부분에 faster RCNN의 문제점을 이야기 해주시면서 classification과 Bonding box rergression을 RPN 에서도 하고 뒷단의 detect부분에서도 똑같이 한다고 하셨습니다. 제가 이해하는 바로는 결국 마지막 부분에서 multi loss를 통해서 한번 역전파 시켜주는 것으로 알았는데, RPN부분에서 따로 weight 갱신이 이루어지는지요..? (inception의 auxiliary와 같은방식으로..) 아니면 FCN방식으로 9x(HW) 2x(HW)를 제안한 것 자체가 중복되는 구조라는 것인지요? >> 요약 : loss를 두번 흘려줘서 학습이 2번 이루어진다고 생각하는 것인지, 아니면 구조만 두번 중복되고 마지막 loss로 다같이 학습이 되는 것인지 궁금합니다.
-
해결됨[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
테이터 셋
안녕하세요 교수님! 이 강의에서 yolov3의 데이터셋도 ms coco데이터로 pre trained 되어있고, 추가적인 다른 데이터셋은 추가하지않은 코드인가요?
-
미해결딥러닝 CNN 완벽 가이드 - TFKeras 버전
선생님 param 계산되는 과정에서 질문이 있습니다.
안녕하세요 선생님, param 계산되는 과정에서 질문이 있습니다. 첫번째 param인 2432는 왜 2432가 나오는지 알겠는데 두번째 param인 9248은 어떻게 9248이 나오는지 잘 모르겠습니다 ㅠㅠㅠ 2432 + (?) = 9248이 되는거 같은데.... (?)는 3*3(kernel_size) * 3(channel)*32(filters) * ? 인거같은데... 제가 직접 계산해보면 9248이 안나옵니다 ㅠㅠㅠ 2432 + (?) = 9248 여기서 ?가 뭔지 알 수 있을까요? 감사합니다!!
-
미해결딥러닝 CNN 완벽 가이드 - TFKeras 버전
초기에 큰 LR 의 적용할시 오버피팅 문제
안녕하세요 선생님 초기에 LR을 크게 할 때 왜 overfitting인지 잘 이해가 가지 않습니다. 초기에 큰 LR을 적용할시 Weight의 급격한 변화로 지역 최적해에 빠져 과적합 가능성이 있다고 언급하십니다. (2:00~3:35쯤 설명) 그런데, 제 생각에는 지역최적해에 빠져 나오지 못 하는 경우, 충분한 학습을 하지 못하고 수렴 한 것이라 overfitting 보다는 under fitting이라고 생각되는데, 왜 overfitting인지 잘 모르겠습니다 . 항상 즐거운 강의 감사합니다 :)
-
해결됨딥러닝 CNN 완벽 가이드 - TFKeras 버전
안녕하세요 교수님 이미지 제너레이터 관련 질문드립니다.
이전 강의들에서는 이미지를 증강 할 때, data_generator.fit(image_batch) data_gen_iter = data_generator.flow(image_batch) aug_image_batch = next(data_gen_iter) 제너레이터에 fit을 하고 flow으로 이터레이터를 생성하고 next로 조금 씩가져오는 것으로 이해하였습니다. 하지만 이번 강의에서는 왜 제너레이터에 fit과 next를 하지 않으시는지 궁금합니다... 또한 제너레이터가 이미지를 생성하는 것이 아니라 flow를 만들어 주고, next로 랜덤하게 적용해서 가져와 주는 것으로 이해하는 것이 맞는지요..? 감사합니다.
-
미해결딥러닝 CNN 완벽 가이드 - TFKeras 버전
선생님 공부하다가 조금 헷갈려서 질문드립니다.
선생님 기존 프로그래밍과 머신러닝의 차이가 기존 프로그래밍은 기존의 알고리즘 수식이나 통계분석 모델을 그대로 사용하여 결과를 산출한다면, 머신러닝은 다양하고 많은 데이터를 통해 알고리즘을 학습시켜서 최적화된 모델을 통한 결과가 산출이라고 한다면.. 회귀분석모델에서 조금 헷갈리는 것이.. 기존의 통계분석의 회귀분석은 머신러닝같은 개념이었던 건지.. 기존의 통계분석인 회귀분석의 회귀계수들도 데이터에 따라 바뀌었는데.. 1:57 의 그림에서 최적의 함수를 찾는다는 부분에서 기존 통계분석의 회귀분석을 생각할 때 갑자기 헷갈려서요..ㅠ
-
해결됨딥러닝 CNN 완벽 가이드 - TFKeras 버전
신경망이 깊어질수록 필터의 개수가 많아지는 이유가 있나요?
안녕하세요, 수업 잘 듣고있습니다! Conv2D의 필터 사이즈가 32, 64, 128 로 점점 커지는데, 점점 필터 사이즈가 커지는 이유가 있나요? 제 예상으로는 * 사실 32, 32, 32도 상관없지만 관례상 필터 사이즈가 커질수록 성능이 좋기 때문 => 이것도 커널 사이즈를 (3, 3) 으로 하냐 (5, 5)로 하냐의 실험적인 문제와 동일하다 또는, * 신경망이 깊어질수록 이미지의 추상적인 특징이 증가하기 때문에 이것을 담을 그릇이 커져야 한다. 이긴 합니다 또, 이것은 별개의 질문인데 너무 헷갈려서요.. 필요한 파라미터의 개수는 kernelSize * kernerSize * filters * channel 라고 하셨는데, INPUT ( None, 28, 28, 3) 이고 Conv2d (filters=32, kernel_size =(3, 3)) 이라면 파라미터 개수는 3 * 3 * 32 * 3 이+ 32 가 될것입니다! 근데 여기서 제 생각으로는, 인풋 채널이 3개긴 하지만, 인풋 채널 3개와 각각의 커널이 합성곱 되어서 나온 결과도 3개이고, 이 결과 3개를 더해서 하나의 행렬로 만들고, 각각의 결과는 모두 같은 필터와 곱해져서 나왔기 때문에 인풋 채널에 영향을 받는다는 내용이 머릿속으로 잘 이해가 안됩니다 ㅠㅠ 이부분도 도와주세요
-
해결됨[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
confidence threshold에 관한 질문
안녕하세요. 이전 강의인 NMS에서도 궁금했는데, confidence 임계값이 어떻게 결정되는지 궁금합니다. IOU 같은 경우는 식으로 설명해주셔서 이해가 가는데, confidence 임계값인 경우에는 그런 것이 없더라구요. 좋은 강의 항상 잘 듣고있습니다. 감사합니다.
-
미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
MASK RCNN 으로 위성지도에서 지붕을 찾는 과제를 하고 있습니다. 학습데이터에 색상이 영향이 있는지 문의드립니다.
MASK RCNN 으로 위성지도에서 지붕을 찾는 과제를 하고 있습니다. 파란색 개통의 공장지붕을 찾으려고 학습데이트를 만들고 실행을 해보았는데 다른 색상의 지붕, 주차장도 찾았습니다. MASK RCCN에 색상정보는 영향이 없는 건지 문의드립니다. 감사합니다.
-
미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
런타임 다시 시작 관련
안녕하세요 선생님, 질문이 있습니다. !pip install mmcv-full 이후에 런타임 다시 시작을 해야 import mmcv가 정상 작동하는데, 코랩 런타임 다시 시작하는 것이 어떤 원리인가요? 런타임 다시 시작을 안하면 import mmcv가 정상 작동하지 않는 이유가 궁금합니다.
-
미해결딥러닝 CNN 완벽 가이드 - TFKeras 버전
각 GD방법에 따른 iteration 횟수가 달라지나요?
안녕하세요! 강의 잘 듣고 있습니다! 제가 알기로는 epoch란 전체 데이터를 모두 관측한 횟수이고 iteration은 한 에포크에서 가중치 갱신이 된 횟수로 알고 있습니다. 전체 데이터가 100개이고, 500번의 epoch을 돌린다고 할 때, GD : 각 데이터당 500번이 인풋 데이터로 선택. 총 50,000번의 학습. iteration도 500. batch_size는 100 SGD : 각 데이터당 평균적으로 5번의 인풋 데이터로 선택. 총 500번의 학습. iteration은 50000. batch_size는 1 Mini - Batch(batch_size = 10) : 각 데이터당 50번의 인풋데이터로 선택. 총 5,000번의 학습. iteration은 5000, batch_size = 10 위 결과처럼 iteration*batch_size의 값은 모두 동일하지만 각 데이터가 학습되는 비중이 다르게 되는 것이 맞을까요? 또, 결론적으로 GD에서 변환되어 나온 SGD와 배치방법(이하 SGD 통일)은 표면적으로는 GD의 "전체 관측 후 갱신" 에서 SGD의 "부분 관측 후 갱신" 이라는 양적 개념이 달라진 것처럼만 보이지만 사실 그 내부에는 GD의 "동일한 데이터 반복 학습"에서 SGD의 "동일한 데이터 반복 학습 횟수 감소"로 볼 수도 있는건가요?
-
미해결딥러닝 CNN 완벽 가이드 - TFKeras 버전
data_generator.fit(image_batch)에서 fit의 의미
설명 중에 fit을 안해도 되는데 나중에 노멀라이제이션도 전체 데이터에 적용되어야하기 때문필요하다고 하던데 잘 이해가 안되는데 fit이 뭔지 궁금합니다.
-
미해결딥러닝 CNN 완벽 가이드 - TFKeras 버전
Node가 1개라는 말이 무슨 말인지 잘 모르겠습니다ㅠㅠㅠㅠ
Node가 1개라는 말이 무슨 말인지 잘 모르겠습니다ㅠㅠㅠㅠ 예시 들어서 한번만 말씀해주실 수 있을까요?
-
미해결딥러닝 CNN 완벽 가이드 - TFKeras 버전
keras vgg16 pretrained 모델 사용할 때 입력 shape에 대해서 질문이 있습니다
안녕하세요 from keras.applications.vgg16 import VGG16 keras 내부에 있는 VGG16을 사용하려고 하는데, 만일 이미지 사이즈가 512x512라면 이를 그대로 shape를 넣어서 진행해도 되나요? 아니면 224x224로 줄여서 넣어줘야 하나요? train 과정은 곧잘 동작은 하는데, imagenet weight에 맞는지 잘 모르겠네요
-
미해결딥러닝 CNN 완벽 가이드 - TFKeras 버전
교차 검증
안녕하세요 머신러닝 완벽가이드 강의에서 최근에 교차검증에 대해서 배웠는데요. 여기서도 k fold와 같은 교차 검증이 가능한지, 실익이 있는지 궁금합니다. 그리고 만약 검증 데이터의 결과가 만족스럽지 않을 때는 무엇을 해 줄 수 있을까요? Dense 추가, 배치 사이즈 작게 등이 생각나는데 다른 것도 있으면 알려주세요. 감사합니다
-
해결됨[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
안녕하십니까 Retinanet에 대한 전반적인 이해를 질문하고자 합니다.
안녕하십니까, 현재 RetinaNet을 구현해보고자 Retitanet paper를 읽고 케라스 공식홈페이지의 Retinanet 예시 코드(https://keras.io/examples/vision/retinanet/#implementing-smooth-l1-loss-and-focal-loss-as-keras-custom-losses) 를 이해하고자 하는데 제가 전반적인 흐름을 이해하질 못하고 있습니다. 본 강의에 있는 Fast RCNN 파트에서, 예측 박스가 Ground Truth 좌표값을 따라가는 것이 아닌 Anchor Box 중에서 Ground Truth와 IOU 높은 Positive Anchor Box를 따라간다고 하였습니다. 그렇다면 1. RetinaNet이 작동하기 전 과정이, 우서적으로 Anchor box들 생성하고 그 중에서 Ground Truth와의 IoU>= 0.5인 Positive Anchor Box 찾기 가 맞는지요. 2. 그리고 RetinaNet 구조를 보면 FPN 에서 나온 P3 ~ P7(Retinanet paper 기준) feature map을 class subnet과 box subnet으로 각각 들어가게 되고, 위 케라스 공식 홈페이지 예제 코드 이때, box subnet의 결과값이 W x H x (4 x 9) 꼴인데, Positive Anchor Box의 좌표는 (x, y, w, h)로 4개인데 어떻게 regression 계산이 되는지 궁금합니다. class subnet에 들어가게 되면 W x H x (num_classes x 9) 꼴의 결과값이 나오는데, 이는 2번질문과 마찬가지로 class labeling은 0,1,2,...과같은 정수형이거나 벡터형으로 나타날텐데 어떻게 regression 계산이 되는지 궁금합니다. 3. 또한, Positive Anchor Box를 제외한 나머지 Anchor Box들은 결국에는 직접적인 학습에 사용되지 않는 것인지요? 만약 사용된다면 Negative Anchor Box(IoU < 0.4)와 Ignorance Anchor Box(0.4 <= IoU < 0.5)가 어떤식으로 사용되는 지에 대해 설명 부탁드립니다. 4. 또한, 한 이미지에 서로 다른 객체가 2개 이상일 때, feature map이 class subnet에 들어가서 도출된 결과값( (num_classes) X 9)이 어떤 방식으로 해당 객체의 레이블과 대응하여 학습되는지 궁금합니다. 예를 들어, 사과(0), 고양이(1), 강아지(3) 클래스가 3개인 데이터셋에서, 사과(0)와 고양이(1)가 존재하는 특정 이미지를 RetinaNet에 training시키게 되면, P3 ~ P7의 feature map이 class subnet으로 들어가서 W x H x (3 x 9)꼴의 결괏값이 나올텐데, 이때 해당 결괏값이 사과(0)인지, 고양이(1)인지 어떤 값이 대응하여 학습해야할 지에 대해서 알 수가 없어 이렇게 질문드립니다. 대략적인 이론을 알고 있다고 생각하여 직접 코딩을 하려했지만, 막막하여 keras 예제를 통해 역으로 이론을 이해하려 시도했습니다. 하지만 코드 자체가 이해가 되질 않고, 어떤 식으로 데이터가 흘러가지는에 대해서도 파악할 수가 없었습니다.. 혼자서 해결해보려 했으나 며칠동안 해결되지 않고 오히려 이해가 되지 않는 부분이 많아져서 이렇게나마 질문을 드립니다...
-
미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
mask rcnn 학습에 관해서
안녕하세요 강의 너무나 잘 듣고 있습니다. 정말 감사드립니다. mask를 학습하는 부분에서 궁금한 점이 있어 질문드립니다. 1. RPN에서 예측해준 바운딩 박스를 align한 최종 14x14x80 feature를 대상으로 mask 를 각 그리드별로 클래스가 positive냐 negative인가만 분류하는 것으로 이해했는데요, 이를 학습하려면 실제 이미지의 각 ground truth box를 14x14로 맞추고 각 그리드의 80개 채널들에 정답을 넣어준 후에 두 14x14x80의 cross entrophy 로 back prop하면 되는 것으로 이해했는데 맞나요? 2. 1번에 대한 이해가 맞다면, 이렇게 해서 나온 3개의 예측값, a.클래스 예측값 b.바운딩 박스 좌표 예측값 c.14x14크기의 마스크 예측 들을 이용해서 14x14크기의 마스크를 예측된 바운딩 박스 좌표 크기에 맞게 resize하고 거기에맞게 마스크값도 할당하고 이를 실제 이미지에 덮어씌운다. 이렇게 하면 바운딩 박스를 그리는 것과 함께 바운딩 박스안에 해당하는 클래스부분 픽셀만 다른 컬러로 구분할 수 있다. 이런식으로 이해했는데, 잘못 이해한 부분이 있다면 지적 부탁드립니다. 감사합니다.
-
해결됨[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
annotation 작업 방법에 관하여
안녕하십니까! 지난번 질문에 대한 답변은 너무 고마웠습니다. colab을 통해서 사용자 dataset을 학습하고 예측 하였을 때 예측이 잘 되지 않았습니다. annotation에 문제가 있지 않을까 하는 생각에 질문 드립니다. 1. 화질이 선명한 대상만 하나요? (사실 선명하다는게 개인차가 좀 있는것 같더라구요.) 2. 대상의 일부가 가렸졌을 때(다른 대상이나 물체에 의해 가려졌을때, 화면 모서리에서 잘렸을 때, 등) 작업 하나요? 3. 바운딩박스는 대상 영역과 거의 일치해야 하나요? (대상과 여유가 있게 또는 대상이 조금 잘리면 문제가 되나요?) 4. 마지막으로 가장 궁금한 항목입니다. 예를 들어 사람이 작업 대상인데 영상에 사람이 엄청나게 많을 경우 모든 사람을 다 작업을 해야 하나요? 아니면 일부만 해도 상관이 없나요? (이런 사진이 학습 dataset에 40% 정도) 어떻게 보면 강의와 상관없는 질문처럼 보일 수 있지만 제가 이 부분에 대해 생각을 많이 하고 있습니다. 부탁드립니다.
-
해결됨[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
KerasYolo3_학습및_Detection 그레이 이미지 출력 에러( 커스텀 데이터)
안녕하세요 강사님 오랜만에 인사드립니다. 강사님이 저번에 가르쳐 주셔서 labellmg 을 이용해서 직접 Dataset을 만들어공부를 하고 있습니다. 그런데 문제가 발생했습니다. 그레이스케일을 그대로 출력하는 문제입니다. 강사님 강의중 "Raccoon 데이터 세트를 YOLO V3로 학습" Code를 이용하여 학습 모델까지 만들었는데 아래 마지막 이미지와 같이 "TypeError: function takes exactly 1 argument (3 given)" 에러가 발생했습니다. 그레이스케일을 RGB로 다시 변경해주는 코드를 생성해줘야하는것은 강의를 들어서 이해했는데 어느부분 Code를 어떻게 수정해야할 지.. 막막해서 질문드립니다. 그레이이미지 그대로 디텍션 하려면 어느부분의 Code가 수정되야할 지 궁금합니다.
-
미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
질문 드립니다. (200519)
안녕하세요 질문이 있어서 글을 남깁니다. builder 디렉토리에서 아래 cmd 명령어를 실행하면 아무것도 뜨지 않습니다. >> python model_builder_test.py 그러나 아래 cmd 명령어를 실행하면 영상에서 보여주신 것처럼 Run, Ok 메시지를 확인할 수 있습니다. (저같은 경우 Ran 19 tests in 0.099s, OK (skipped=1)라는 메시지가 떴습니다) >> python model_builder_tf1_test.py 그래서 코드를 살펴봤는데 model_builder_test.py 에는 main 함수가 없고 model_builder_tf1_test.py에는 main 함수가 있습니다. 정확하게 표현하기 위해 아래 코드가 model_builder_test.py에는 없고 model_builder_tf1_test.py에는 있다고 말씀드리겠습니다. if __name__ == '__main__': tf.test.main() 혹시 영상 올리실때와 제가 실제로 실행한 시점(200519) 사이에 업데이트가 있었던 건지 아니면 model_builder_test.py를 실행했을때 Run, Ok 메시지가 잘 나와야 되는데 잘 안나온건지 궁금합니다. 감사합니다.