월 24,200원
5개월 할부 시다른 수강생들이 자주 물어보는 질문이 궁금하신가요?
- 미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
이론에 대한 이해
실습강의는 그래도 강의 따라가면서 코드 한줄한줄 그 의미를 이해하려고 노력하다보니 어느정도 괜찮았는데, RCNN 들어오고나서부터 이론에 대한 내용들이 정말 이해가 어렵습니다 ... 특정 한 부분이 어려워서 질문하면 해결되는 정도라기보다는 논문을 기반으로 설명해주시는 거 같아서 이러한 흐름 자체가 저에겐 너무 난해한 것 같습니다 ㅜㅜ OpenCV 실습 강의에서 이미지처리와 영상처리할 때는 나름 재밌었는데 이론에서 이렇게 막혀버리니까 흥미를 팍 잃어버려서 이러한 이론적인 내용들을 꼭 알아야하나 싶은 생각도 계속 드네요 ... 들리는 말로는 YOLO에 대해 흥미로워하는 사람들이 많다는 이야기도 들었는데 아직 저기까지 가기에는 진도가 한참 남았고 이 구간을 어찌해야할지 모르겠습니다. 계속 꾹 참고 들어보려고는 하나 머리에 남는 것 없이 강의만 듣게 되는 것 같아서요 ... 혹시 object detection에 관한 실무적인 내용만 알고 싶다면 이론강의를 건너뛰어넘어도 될까요 ..? RCNN부터 Faster RCNN까지 들은 상황인데 정말 막막합니다 ㅜㅜ
- 미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
.pt 파일에서 .tflite로 어떻게 변환하는지 궁금합니다.
custom dataset으로 weight모델을 만들어 android에 연동을 하고자 합니다. android는 .pt이 아닌 .tflite를 사용하는데 혹시 변환하는 방법을 알수있을까요?
- 미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
yolov5 train
안녕하세요! yolov5도 train 하는 것이 (데이터 디렉토리, yaml 구성) yolov3와 똑같다고 보면 되죠?
- 미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
wandb cli 입력 문제
안녕하세요 colab 말고 개인 로컬에서 wandb 실습을 진행하고 있는데 CLI 입력 창이 안나와서, 사전에 로그인 함수를 호출해서 API 키를 입력하니 잘되네요.. import wandb wandb.login()
- 미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
공부방법 질문
강의 내용은 어느 정도 이해해가면서 듣고 있기는 한데, 누가 저보고 이러한 코드를 직접 작성해보라고 한다면 어떠한 특정 상황에서 무슨 패키지와 라이브러리를 임포트해와야하는지부터 막힐 것 같습니다 ㅜㅜ 본 강의가 딥러닝 기초에 대해 알고 있다는 전제하에 만들어졌다고 하셨지만, 어떤 걸로 먼저 공부해야되는지 모르겠어서 우선 이걸로 시작을 해보고 있는데 단순히 내용 이해만 해가면서 듣기에는 직접 코드도 못 짜는 등 한계가 명확할 것 같다는 느낌이 듭니다. 선생님이 생각하시기엔 그래도 이 강의를 계속 들어보는 게 나을까요, 아니면 선수지식을 따로 공부하고 오는 게 나을까요? 선수지식을 따로 공부하는 게 나을 것 같다면 무엇을 어느 정도까지 공부해야할지도 알려주실 수 있을까요?
- 미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
multi gpu사용방법
안녕하세요 강사님. 혹시 multi gpu사용을 위해서는 어떻게 설정을 해주어야하는지 알 수 있을까요??? 찾아보니까 여기서 'find_unused_parameters'와 관련된 세팅을 해야하는 것 같은데 저 주석이 정확히 어떻게 하라는 건지 이해가 안되서 질문드립니다! ##추가질문 그리고 추가로 pretrained된 모델을 재학습시키는 것이 아닌 그냥 아직 학습이 하나도 되지 않은 모델을 학습시키려면 config에서 checkpoint을 통해서 pretrained된 모델을 불러오는 과정만 없애주면 되는건가요??
- 미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
강의 내용 질문
SSD 강의 듣고 있는 중입니다. 혹시 실시간 detection 에 대한 강의도 있나요??
- 미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
깃허브에 있는 딥러닝 모델 가져오기(깃허브 오픈소스 사용법)
안녕하세요 아직 많이 듣지는 않았지만 ㅎ 유익한 강의 정말 잘 듣고 있습니다.! 다름이 아니라 최근 초해상화(Super resolution)에 관심이 다양한 딥러닝 모델들을 찾아보았습니다. 아직 논문을 보고 코드를 구현하기에는 많이 부족해서 다른 사람들이 깃허브에 업로드한 딥러닝 모델들을 적용해보고 싶은데 활용방법에 익숙치 않습니다. 예를들어 SRCNN모델을 적용해보고싶어 https://github.com/TheStarkor/SRCNN-tensorflow2 이 깃허브를 활용하고 싶을때 어떻게 자신만의 데이터를 학습시키고 output 데이터를 도출할 수 있는지 잘 감이 잡히지 않아 질문드립니다.
- 미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
NMS 사용 시점에 대한 문의
- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 서로 예의를 지키며 존중하는 문화를 만들어가요. - 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요. 안녕하세요, 강의 잘 듣고 있습니다. 다름이 아니라, IoU, NMS강의를 듣고 있는데요, NMS 가 selective_search의 confidence score랑 IoU를 이용하여 낮은 bbox를 걸러낸다고 말씀하셨는데, IoU는 ground truth가 있어야 산정 가능한게 아닌가요? NMS를 사용하는 시점은 예측시점인데 ground truth를 어디서 가져오는지 궁금합니다. selective_search에서 gound_truth를 알수가 있나요?
- 미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
mmdetection 학습 중 이미지 파일명 출력 방법에 대해서 문의드립니다.
안녕하세요. mmdetection을 통해서 데이터를 순차적으로 읽어오려고 하고 있습니다. 관련 설정 변경으로 shuffle 부분을 변경하긴 했는데 실제로 데이터가 순차적으로 오는지 확인하기 위해서, batch size 크기로 파일명을 모델 학습 시, 출력을 해보고 싶은데.. 구조가 너무 복잡하다보니 어디에 코드를 넣는게 좋을지 잘 모르겠습니다. 혹시 어디 부분을 수정하면 좋을지 조언을 받을 수 있을까요?
- 미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
rows, cols 곱하는 이유
- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 서로 예의를 지키며 존중하는 문화를 만들어가요. - 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요. (633, 806) 이미지를 (300, 300)으로 resize 해서 detection을 했는데 bounding box 좌표 값에 왜 633과 806을 곱하는거죠? 원본 이미지 비율로 계산하려면 633/300과 806/300을 곱해야 하는거 아닌가요 그리고 (300, 300)으로 resize를 하는 이유는 ssd 모델의 입력이 (300, 300)으로 고정되어 있기 때문인가요??
- 미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
SSD를 사용해서 프로젝트를 진행하려고 합니다.
안녕하세요. 항상 좋은 강의 제공해주셔서 감사드립니다. 제가 openCV에서 SSD를 활용하여 작물의 질병영역을 검출하는 프로젝트를 진행하려고 합니다. annotation이 이루어진 질병 영역 이미지가 충분하다고 할때, 학습을 시키려면 어떻게 진행해야 하는지 알고 싶습니다.
- 해결됨[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
안녕하세요 강사님 FC가 적용되지 않는 경우 loss관련 질문드립니다.
안녕하세요 강사님. 수업 정말 잘 듣고있습니다. 지난 CNN강의부터 쭉 공부를 해보았는데도 직접 구현해보려고 하니까 계속 두루뭉실 이해가 되지 않는 부분이 있어서 질문드립니다. 마지막 출력단이 FC의 경우 loss라는 것이 결국 1차원의 긴 벡터의 요소의 각각의 오차를 구해서 쭉 합친것 혹은 평균낸 것 이라고 이해했는데, yolo v3나, 그 외의 마지막을 convolution연산으로 바꾼 모델들은 마지막 출력이 2차원 평면(x배치수)인데, loss를 어떻게 계산하는지 궁금합니다. [질문] 2차원 각 셀 부분별로 나온 다양한 종류의 loss들을 multi loss로 통합하여, 각 셀별 오차를 구하고 = 오차가 (16x16x배치수)처럼 나오고, FC오차와 같이 결국 모든 셀(16x16)의 개별 요소들의 합을 구하는 것이 맞는지요...? 바쁘실텐데 복잡한 질문 죄송합니다. 감사합니다.
- 해결됨[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
안녕하세요 강사님, RPN 힉습관련하여 질문드립니다.
안녕하세요 강사님. 수업 항상 잘 듣고있습니다. 바쁘시겠지만.. detection 학습관련하여 계속 헷갈리는 부분 있어서.. 질문드립니다. 이번 강의 중간 부분에 faster RCNN의 문제점을 이야기 해주시면서 classification과 Bonding box rergression을 RPN 에서도 하고 뒷단의 detect부분에서도 똑같이 한다고 하셨습니다. 제가 이해하는 바로는 결국 마지막 부분에서 multi loss를 통해서 한번 역전파 시켜주는 것으로 알았는데, RPN부분에서 따로 weight 갱신이 이루어지는지요..? (inception의 auxiliary와 같은방식으로..) 아니면 FCN방식으로 9x(HW) 2x(HW)를 제안한 것 자체가 중복되는 구조라는 것인지요? >> 요약 : loss를 두번 흘려줘서 학습이 2번 이루어진다고 생각하는 것인지, 아니면 구조만 두번 중복되고 마지막 loss로 다같이 학습이 되는 것인지 궁금합니다.
- 미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
mask-rcnn nucleus 실습 관련 중 질문드립니다.
안녕하세요. nucleus instance segmentation 실습 중 궁금한 것이 생겨 질문드립니다. 친절하고 상세한 설명 덕분에 기존의 강의 가이드를 따라서 결과까지 잘 구현 하였습니다. 그러던 중, 한가지 질문이 생겼습니다. 기존의 지도학습으로 segmentation 시키는 것이 아니라, 정답 mask 없이, model을 통해 나온 output feature 값들에 대한 k-means clustering을 통해서 그 feature들을 군집화 하여, 군집화된 값들을 레이블로서 정답기준으로 삼고 모델을 트레이닝 시켜서 segmentation 시키는 것이 가능할까요...? 이를 위한 구현 아이디어는 제가 스크레치로 하는게 더 나을까요..? 감사합니다.
- 미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
mmdetection config 질문드립니다.
data = dict( samples_per_gpu=2, workers_per_gpu=2, train=dict( type=dataset_type, ann_file=data_root + 'annotations/instances_train2017.json', img_prefix=data_root + 'train2017/', pipeline=train_pipeline), 안녕하세요. 선생님 config 관련 정보를 보다가 samples_per_gpu 와 workers_per_gpu에 대해서 알고 싶어 질문드립니다.GPU 하나를 쓴다고 하였을 때,samples_per_gpu의 경우는 batch_size와 동일해진다고 해석을 하였는데...이 해석이 맞는지 헷갈려서 문의드립니다.그리고 workers_per_gpu 부분은 정확히 무슨 의미인지, 그리고 숫자 증가에 따라 어떤 차이가 발생하고어떻게 선정을 하는 것인지 궁금합니다.단순 구글 검색해서 nums_worker 같은 경우, cpu에서 gpu로 데이터를 넘기는데 cpu 코어를 얼마나 할당해서 gpu로 데이터를 넘길 것인가 부분이라고 나왔는데이 내용이 config의 workers_per_gpu랑은 다른 내용인 것 같아 질문드립니다.항상 좋은 강의 감사드립니다.
- 미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
mmdetection cofig 중 randomflip에 대해 질문드립니다.
config 설정 중, data augumentation과 관련해서 1. randomflip 과 rotation의 경우,batch-size 기준으로 일괄적으로 적용이 받는지 궁금합니다. 똑같이 적용이 되는지 아니면, 이미지 하나하나 다르게 flip과 rotation이 적용 받는지 궁금합니다. 예를 들어 flip_ratio=0.5의 경우, 대략 50% 정도 flip 된다고 이해는 하고 있는데 batch size기준으로 일괄 적용이 되는 것인지 아니면 이미지 하나마다 독립적으로 적용이 되는지 내부 절차가 궁금합니다.
- 미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
cand_box
1. cand_box를 따로 정의하지 않아도 rect처럼 (a,b,c,d)로 출력되나요? gt_box의 좌표를 [60,15,320,420]으로 설정한 걸 보고 둘 다 새롭게 정의한 변수인 줄 알았거든요. 그리고 어떤 바운딩 박스의 좌표를 설정할 때 소괄호(())와 대괄호([]) 둘 중 무엇을 써도 상관없나요? 2. cand_box = list(cand_box) cand_box[2] += cand_box[0] cand_box[3] += cand_box[1] rect와 달리 cand_box의 좌표는 튜플을 리스트로 변환한 이유가 무엇인가요? 그리고 cand_box의 [2]와 [3]을 각각 너비와 높이에서 우하단의 좌표로 변경한 이유가 무엇인지와 저렇게 정의하지 않으면 각각 너비와 높이로 출력되는 건지 궁금합니다!
- 미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
scale과 cand_rects
1. min_size는 bounding box의 최소 크기를 제한하는 건 알겠는데, scale은 무슨 의미이길래 값을 크게 하면 bounding box의 개수가 줄어드나요 ? 2. cand_rects = [cand['rect'] for cand in regions] regions에 속한 모든 요소에 대해 cand를 반복한다는 건 알겠는데, 이 반복문의 의미를 풀어서 설명해주실 수 있나요 ?
- 미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
객체 탐지 모델 학습시 데이터 구성
안녕하세요. 현재 객체 탐지 모델을 공부하고 있는 중인데, 궁금한 점이 있어서 질문드립니다. 사전학습된 모델을 Custom 데이터로 학습시킬 때, 학습 데이터로 1) 한 이미지속에 다양한 클래스의 여러 객체가 존재하는 이미지와 Annotation으로 학습시키는 것과 2) 한 이미지속 하나의 클래스의 여러 객체가 존재하는 이미지와 Annotation으로 학습하는 것중에 어떤 방법이 더 적절한가요?