묻고 답해요
158만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결딥러닝 CNN 완벽 가이드 - TFKeras 버전
선생님 공부하다가 조금 헷갈려서 질문드립니다.
선생님 기존 프로그래밍과 머신러닝의 차이가 기존 프로그래밍은 기존의 알고리즘 수식이나 통계분석 모델을 그대로 사용하여 결과를 산출한다면, 머신러닝은 다양하고 많은 데이터를 통해 알고리즘을 학습시켜서 최적화된 모델을 통한 결과가 산출이라고 한다면.. 회귀분석모델에서 조금 헷갈리는 것이.. 기존의 통계분석의 회귀분석은 머신러닝같은 개념이었던 건지.. 기존의 통계분석인 회귀분석의 회귀계수들도 데이터에 따라 바뀌었는데.. 1:57 의 그림에서 최적의 함수를 찾는다는 부분에서 기존 통계분석의 회귀분석을 생각할 때 갑자기 헷갈려서요..ㅠ
-
해결됨딥러닝 CNN 완벽 가이드 - TFKeras 버전
신경망이 깊어질수록 필터의 개수가 많아지는 이유가 있나요?
안녕하세요, 수업 잘 듣고있습니다! Conv2D의 필터 사이즈가 32, 64, 128 로 점점 커지는데, 점점 필터 사이즈가 커지는 이유가 있나요? 제 예상으로는 * 사실 32, 32, 32도 상관없지만 관례상 필터 사이즈가 커질수록 성능이 좋기 때문 => 이것도 커널 사이즈를 (3, 3) 으로 하냐 (5, 5)로 하냐의 실험적인 문제와 동일하다 또는, * 신경망이 깊어질수록 이미지의 추상적인 특징이 증가하기 때문에 이것을 담을 그릇이 커져야 한다. 이긴 합니다 또, 이것은 별개의 질문인데 너무 헷갈려서요.. 필요한 파라미터의 개수는 kernelSize * kernerSize * filters * channel 라고 하셨는데, INPUT ( None, 28, 28, 3) 이고 Conv2d (filters=32, kernel_size =(3, 3)) 이라면 파라미터 개수는 3 * 3 * 32 * 3 이+ 32 가 될것입니다! 근데 여기서 제 생각으로는, 인풋 채널이 3개긴 하지만, 인풋 채널 3개와 각각의 커널이 합성곱 되어서 나온 결과도 3개이고, 이 결과 3개를 더해서 하나의 행렬로 만들고, 각각의 결과는 모두 같은 필터와 곱해져서 나왔기 때문에 인풋 채널에 영향을 받는다는 내용이 머릿속으로 잘 이해가 안됩니다 ㅠㅠ 이부분도 도와주세요
-
해결됨[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
confidence threshold에 관한 질문
안녕하세요. 이전 강의인 NMS에서도 궁금했는데, confidence 임계값이 어떻게 결정되는지 궁금합니다. IOU 같은 경우는 식으로 설명해주셔서 이해가 가는데, confidence 임계값인 경우에는 그런 것이 없더라구요. 좋은 강의 항상 잘 듣고있습니다. 감사합니다.
-
미해결Google 공인! 텐서플로(TensorFlow) 개발자 자격증 취득
딥러닝 모델에서 hidden layer의 개수는 어떻게 정해야 하나요?(tf자격증 강의)
안녕하세요, 텐서플로우 자격시험 강의를 듣다 의문이 들어 질문드립니다. 1) hidden layer를 보면 5개 쌓은 것으로 이해됩니다(input layer, output layer 제외) 5개인 이유가 뭘까요? 어떤 기준으로 층 개수를 정하는 걸까요 2) layer의 unit를 2의 제곱수로 절반씩 줄이는데, 이것의 의미가 궁금합니다. 정하는 기준이 있다면 그것도 궁금합니다 감사합니다.
-
미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
MASK RCNN 으로 위성지도에서 지붕을 찾는 과제를 하고 있습니다. 학습데이터에 색상이 영향이 있는지 문의드립니다.
MASK RCNN 으로 위성지도에서 지붕을 찾는 과제를 하고 있습니다. 파란색 개통의 공장지붕을 찾으려고 학습데이트를 만들고 실행을 해보았는데 다른 색상의 지붕, 주차장도 찾았습니다. MASK RCCN에 색상정보는 영향이 없는 건지 문의드립니다. 감사합니다.
-
미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
런타임 다시 시작 관련
안녕하세요 선생님, 질문이 있습니다. !pip install mmcv-full 이후에 런타임 다시 시작을 해야 import mmcv가 정상 작동하는데, 코랩 런타임 다시 시작하는 것이 어떤 원리인가요? 런타임 다시 시작을 안하면 import mmcv가 정상 작동하지 않는 이유가 궁금합니다.
-
미해결[인공지능 컴퓨터비전] 20장의 사진으로 딥러닝 모델 만들기
여기서 더이상 안됩니다.. ㅠㅠ 컴맹이라 그런가..
-
미해결딥러닝 CNN 완벽 가이드 - TFKeras 버전
각 GD방법에 따른 iteration 횟수가 달라지나요?
안녕하세요! 강의 잘 듣고 있습니다! 제가 알기로는 epoch란 전체 데이터를 모두 관측한 횟수이고 iteration은 한 에포크에서 가중치 갱신이 된 횟수로 알고 있습니다. 전체 데이터가 100개이고, 500번의 epoch을 돌린다고 할 때, GD : 각 데이터당 500번이 인풋 데이터로 선택. 총 50,000번의 학습. iteration도 500. batch_size는 100 SGD : 각 데이터당 평균적으로 5번의 인풋 데이터로 선택. 총 500번의 학습. iteration은 50000. batch_size는 1 Mini - Batch(batch_size = 10) : 각 데이터당 50번의 인풋데이터로 선택. 총 5,000번의 학습. iteration은 5000, batch_size = 10 위 결과처럼 iteration*batch_size의 값은 모두 동일하지만 각 데이터가 학습되는 비중이 다르게 되는 것이 맞을까요? 또, 결론적으로 GD에서 변환되어 나온 SGD와 배치방법(이하 SGD 통일)은 표면적으로는 GD의 "전체 관측 후 갱신" 에서 SGD의 "부분 관측 후 갱신" 이라는 양적 개념이 달라진 것처럼만 보이지만 사실 그 내부에는 GD의 "동일한 데이터 반복 학습"에서 SGD의 "동일한 데이터 반복 학습 횟수 감소"로 볼 수도 있는건가요?
-
미해결딥러닝 CNN 완벽 가이드 - TFKeras 버전
data_generator.fit(image_batch)에서 fit의 의미
설명 중에 fit을 안해도 되는데 나중에 노멀라이제이션도 전체 데이터에 적용되어야하기 때문필요하다고 하던데 잘 이해가 안되는데 fit이 뭔지 궁금합니다.
-
미해결딥러닝 CNN 완벽 가이드 - TFKeras 버전
Node가 1개라는 말이 무슨 말인지 잘 모르겠습니다ㅠㅠㅠㅠ
Node가 1개라는 말이 무슨 말인지 잘 모르겠습니다ㅠㅠㅠㅠ 예시 들어서 한번만 말씀해주실 수 있을까요?
-
미해결딥러닝 CNN 완벽 가이드 - TFKeras 버전
교차 검증
안녕하세요 머신러닝 완벽가이드 강의에서 최근에 교차검증에 대해서 배웠는데요. 여기서도 k fold와 같은 교차 검증이 가능한지, 실익이 있는지 궁금합니다. 그리고 만약 검증 데이터의 결과가 만족스럽지 않을 때는 무엇을 해 줄 수 있을까요? Dense 추가, 배치 사이즈 작게 등이 생각나는데 다른 것도 있으면 알려주세요. 감사합니다
-
해결됨[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
안녕하십니까 Retinanet에 대한 전반적인 이해를 질문하고자 합니다.
안녕하십니까, 현재 RetinaNet을 구현해보고자 Retitanet paper를 읽고 케라스 공식홈페이지의 Retinanet 예시 코드(https://keras.io/examples/vision/retinanet/#implementing-smooth-l1-loss-and-focal-loss-as-keras-custom-losses) 를 이해하고자 하는데 제가 전반적인 흐름을 이해하질 못하고 있습니다. 본 강의에 있는 Fast RCNN 파트에서, 예측 박스가 Ground Truth 좌표값을 따라가는 것이 아닌 Anchor Box 중에서 Ground Truth와 IOU 높은 Positive Anchor Box를 따라간다고 하였습니다. 그렇다면 1. RetinaNet이 작동하기 전 과정이, 우서적으로 Anchor box들 생성하고 그 중에서 Ground Truth와의 IoU>= 0.5인 Positive Anchor Box 찾기 가 맞는지요. 2. 그리고 RetinaNet 구조를 보면 FPN 에서 나온 P3 ~ P7(Retinanet paper 기준) feature map을 class subnet과 box subnet으로 각각 들어가게 되고, 위 케라스 공식 홈페이지 예제 코드 이때, box subnet의 결과값이 W x H x (4 x 9) 꼴인데, Positive Anchor Box의 좌표는 (x, y, w, h)로 4개인데 어떻게 regression 계산이 되는지 궁금합니다. class subnet에 들어가게 되면 W x H x (num_classes x 9) 꼴의 결과값이 나오는데, 이는 2번질문과 마찬가지로 class labeling은 0,1,2,...과같은 정수형이거나 벡터형으로 나타날텐데 어떻게 regression 계산이 되는지 궁금합니다. 3. 또한, Positive Anchor Box를 제외한 나머지 Anchor Box들은 결국에는 직접적인 학습에 사용되지 않는 것인지요? 만약 사용된다면 Negative Anchor Box(IoU < 0.4)와 Ignorance Anchor Box(0.4 <= IoU < 0.5)가 어떤식으로 사용되는 지에 대해 설명 부탁드립니다. 4. 또한, 한 이미지에 서로 다른 객체가 2개 이상일 때, feature map이 class subnet에 들어가서 도출된 결과값( (num_classes) X 9)이 어떤 방식으로 해당 객체의 레이블과 대응하여 학습되는지 궁금합니다. 예를 들어, 사과(0), 고양이(1), 강아지(3) 클래스가 3개인 데이터셋에서, 사과(0)와 고양이(1)가 존재하는 특정 이미지를 RetinaNet에 training시키게 되면, P3 ~ P7의 feature map이 class subnet으로 들어가서 W x H x (3 x 9)꼴의 결괏값이 나올텐데, 이때 해당 결괏값이 사과(0)인지, 고양이(1)인지 어떤 값이 대응하여 학습해야할 지에 대해서 알 수가 없어 이렇게 질문드립니다. 대략적인 이론을 알고 있다고 생각하여 직접 코딩을 하려했지만, 막막하여 keras 예제를 통해 역으로 이론을 이해하려 시도했습니다. 하지만 코드 자체가 이해가 되질 않고, 어떤 식으로 데이터가 흘러가지는에 대해서도 파악할 수가 없었습니다.. 혼자서 해결해보려 했으나 며칠동안 해결되지 않고 오히려 이해가 되지 않는 부분이 많아져서 이렇게나마 질문을 드립니다...
-
해결됨[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
RCNN에서 여러개의 Region Proposal 들 사이즈 통일 관해 질문입니다!
안녕하세요! 다름이 아니라 RCNN 의 Stage1에서 수행되는 Region Proposal에 관한 질문인데요! Stage1에서 약 2000개의 Region Proposal 들이 수행되는데 이것들이 Stage2의 Feature Extractor로 들어가 각 Region Proposal의 특징들을 추출해 Feature map을 완성시키잖아요!? 이 때 강의에서 선생님께서 설명해주셨다시피 Feature Extractor에 따라 Region Proposal의 각기 다른 사이즈를 하나로(강의에서는 아마 257 by 257 이였나.. 그랬을 겁니다..!) 통일 시켜주어야 한다고 하셨잖아요!? 그렇다면 이 Region Proposal들의 사이즈를 통일시켜주는 것은 Feature Extractor가 무슨 종류인지에 따라 달라지는 거겠죠? 제가 Alex net일 때 들어가야 하는 사이즈가 몇이고 VGG일 때는 몇이고 또 다른 CNN모델들은 몇 사이즈여야 한다는 것을 잘 몰라서요! 만약 서로 다르다면 어느정도 통일시켜주는 사이즈 범위가 있을까요? 예를 들어 250~300 사이로 한다던가... 답변 부탁드리곘습니다! 질 좋은 강의에 감사인사드립니다 :)
-
해결됨[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
AP, mAP의 차이점과 Ground Truth Bounding Box 질문입니다!
안녕하세요! 선생님, 예전 머신러닝 강의도 들어왔는데 이번 컴퓨터 비전 강의도 듣게 된 애청자 입니다! 다름이 아니라 질문이 있는데요! 1. AP와 mAP의 차이점에 대해 언급해주실 때 AP는 하나의 오브젝트에 대한 Precision 평균값이고 mAP는 여러 오브젝트에 대한 Precision 평균값들의 '평균값'이라고 설명해주셨는데요! 그렇다면 예를 들어 어떤 이미지에 자동차, 사람, 강아지 이렇게 3개의 오브젝트들이 있을 때 자동차에 대한 AP 따로, 사람에 대한 AP 따로, 강아지에 대한 AP 따로 계산을 하고 이 3가지를 평균값을 낸 걸로 이해하면 맞을까요? 2. 이전 강의에서 Bounding Box를 찾는 게 Regression 문제라고 하셨잖아요!? 그렇다면 어쨋거나 Ground Truth Bounding Box 좌표가 주어진 상태에서 뉴럴 넷이 Regression을 하는 지도학습이라고 볼 수 있는 거죠? 만약 지도학습이라고 한다면 각 이미지 마다 Ground Truth Bounding Box 좌표들은 사람이 직접 레이블링 해주어야 하는 건가요? 뉴럴넷이 알아서 Ground Truth Bounding Box를 찾아서 그 좌표로 수렴할 순 없지 않나요? 뉴럴넷이 찾은 Ground Truth 좌표가local minimum 인지 global minimum인지는 정확히 알 수 없으니까요..? 혹여나 제가 잘못알고 있는 지식이 있다면 지적은 환영입니다! 답변 기다리겠습니다~!
-
미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
mask rcnn 학습에 관해서
안녕하세요 강의 너무나 잘 듣고 있습니다. 정말 감사드립니다. mask를 학습하는 부분에서 궁금한 점이 있어 질문드립니다. 1. RPN에서 예측해준 바운딩 박스를 align한 최종 14x14x80 feature를 대상으로 mask 를 각 그리드별로 클래스가 positive냐 negative인가만 분류하는 것으로 이해했는데요, 이를 학습하려면 실제 이미지의 각 ground truth box를 14x14로 맞추고 각 그리드의 80개 채널들에 정답을 넣어준 후에 두 14x14x80의 cross entrophy 로 back prop하면 되는 것으로 이해했는데 맞나요? 2. 1번에 대한 이해가 맞다면, 이렇게 해서 나온 3개의 예측값, a.클래스 예측값 b.바운딩 박스 좌표 예측값 c.14x14크기의 마스크 예측 들을 이용해서 14x14크기의 마스크를 예측된 바운딩 박스 좌표 크기에 맞게 resize하고 거기에맞게 마스크값도 할당하고 이를 실제 이미지에 덮어씌운다. 이렇게 하면 바운딩 박스를 그리는 것과 함께 바운딩 박스안에 해당하는 클래스부분 픽셀만 다른 컬러로 구분할 수 있다. 이런식으로 이해했는데, 잘못 이해한 부분이 있다면 지적 부탁드립니다. 감사합니다.
-
해결됨실전 인공지능으로 이어지는 딥러닝 개념 잡기
XOR 문제 행렬 연산
XOR문제 영상 6분 40초 쯤 입력값을 행렬로 넣을 때 왜 전치 행렬이 사용되는지 잘 모르겠습니다. 행렬계산의 공식 같은 것인 가요? 아니면 x1과 x2가 원래 열로 들어오다가 행으로 들어가서 전치 행렬이 필요한 건가요? 그리고 H와 X 순서가 바뀌는 이유는 입출력을 4Xn 행렬로 만들기 위해서 인가요?
-
해결됨[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
annotation 작업 방법에 관하여
안녕하십니까! 지난번 질문에 대한 답변은 너무 고마웠습니다. colab을 통해서 사용자 dataset을 학습하고 예측 하였을 때 예측이 잘 되지 않았습니다. annotation에 문제가 있지 않을까 하는 생각에 질문 드립니다. 1. 화질이 선명한 대상만 하나요? (사실 선명하다는게 개인차가 좀 있는것 같더라구요.) 2. 대상의 일부가 가렸졌을 때(다른 대상이나 물체에 의해 가려졌을때, 화면 모서리에서 잘렸을 때, 등) 작업 하나요? 3. 바운딩박스는 대상 영역과 거의 일치해야 하나요? (대상과 여유가 있게 또는 대상이 조금 잘리면 문제가 되나요?) 4. 마지막으로 가장 궁금한 항목입니다. 예를 들어 사람이 작업 대상인데 영상에 사람이 엄청나게 많을 경우 모든 사람을 다 작업을 해야 하나요? 아니면 일부만 해도 상관이 없나요? (이런 사진이 학습 dataset에 40% 정도) 어떻게 보면 강의와 상관없는 질문처럼 보일 수 있지만 제가 이 부분에 대해 생각을 많이 하고 있습니다. 부탁드립니다.
-
해결됨[PyTorch] 쉽고 빠르게 배우는 NLP
NLP에 RNN을 사용하는 이유
본 강의에 NLP 방법으로 RNN이 나와있는데 인공지능에는 RNN 뿐만 아니라 GAN도 있고 뭐 여러가지가 있잖아요 그 중에서 RNN 기법을 꼭 사용해야 하는 이유가 있나요? R&D 사업계획서 같은 거를 쓸 때 어떤 토픽에 대한 해결 방법을 무슨 무슨 인공지능 기법을 쓴다고 할 때 그 기법을 쓰는 이유로 반 페이지에서 1페이지 가량 써야한다고 하면 어떤 걸 적는 게 좋을까요?
-
미해결TensorFlow 2.0으로 배우는 딥러닝 입문
안녕하세요 MSE 질문합니다.
안녕하세요 '머신러닝의 기본 프로세스'를 공부하고 있습니다. 2분43초~ 5분30초에서 MSE가 오차의 제곱의 합을 개수로 나눈 것으로 알고 있는데(오차 제곱의 평균) 그런데 여기에 1/2을 곱한 이유는 무엇인가요?
-
해결됨[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
KerasYolo3_학습및_Detection 그레이 이미지 출력 에러( 커스텀 데이터)
안녕하세요 강사님 오랜만에 인사드립니다. 강사님이 저번에 가르쳐 주셔서 labellmg 을 이용해서 직접 Dataset을 만들어공부를 하고 있습니다. 그런데 문제가 발생했습니다. 그레이스케일을 그대로 출력하는 문제입니다. 강사님 강의중 "Raccoon 데이터 세트를 YOLO V3로 학습" Code를 이용하여 학습 모델까지 만들었는데 아래 마지막 이미지와 같이 "TypeError: function takes exactly 1 argument (3 given)" 에러가 발생했습니다. 그레이스케일을 RGB로 다시 변경해주는 코드를 생성해줘야하는것은 강의를 들어서 이해했는데 어느부분 Code를 어떻게 수정해야할 지.. 막막해서 질문드립니다. 그레이이미지 그대로 디텍션 하려면 어느부분의 Code가 수정되야할 지 궁금합니다.