월 24,200원
5개월 할부 시다른 수강생들이 자주 물어보는 질문이 궁금하신가요?
- 미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
동영상 라벨링
안녕하세요 선생님! 자유주제에 질문을 잘못 남겨 여기에 다시올립니다! 제가 5분짜리 ai hub에서 제공한 이상행동 동영상을 초당 프레임으로 나눠서 이상행동만 라벨링하여 yolov5에 맞게 데이터셋을 구축하고있습니다. 동영상을 150장정도의 이미지로 나누고 이상행동에 대한 라벨링을 하다보니 150장 중 라벨링 된 이미지는 30장 정도이고, 나머지 이미지는 빈 txt를 만들어져 150장 모두가 yolov5에 맞게 데이터셋을 만들고있는데 이 데이터셋을 갖고 학습을 시킬 경우 30장만 학습시키는게 좋은 결과값이 나오는지 150장을 모두 학습시키는게 좋은결과 값이 나오는지 궁금합니다!! 감사합니다 선생님
- 미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
MMDetection 관련 에러
안녕하세요, 좋은강의 감사드립니다. 코랩에서 실습을 해보고 있는데 2018 nucleus 강좌부분에서 MMDetection 관련 에러가 있습니다. from mmdet.apis import init_detector, inference_detector 에서 아래와 같이 에러가 나는데요, 혹시 어떻게 해결해야 할까요?
- 미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
YoloV3 와 yolov5 전이학습 pt 파일 크기 차이
안녕하십니까 교수님 yolov3. 253 장의 데이터를 사용해 학습하고 yolov5. 는 V3에 사용했던 253장과 추가 데이터 총 1839 장의 데이터를 사용해 학습을 진행했는데요 V3, V5성능차이가 있기때문에 학습시간의 차이가 있는것은 알겠으나 PT파일의 용량차이가 너무 큽니다 V3의 경우 481MB V5 의 경우 14 MB 인데요 훨씬 많은 데이터를 사용했고 동일하게 80 epoch씩을 학습시켰는데 이렇게 버전에 따라 모델의 용량차이가 극명하게 나는것이 맞는건가요? v5 전이학습 V3 전이학습
- 미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
Python 프로젝트에 적용하기에 가장 적합한 형태의 모델은 어떤 형식인가요?
Open CV를 활용한 파이썬 PC 프로그램을 만들고자 하는데요 기존에는 classification 만 하려는 목적으로 .h5 형태의 모델을 사용했었는데 Object Detection 바꾸게 되었습니다 처음엔 YOLO 전이학습이 가장 쉽게 모델을 추출할수 있는것 같아서 YOLOV5 전이학습을 통해 나온 .pt 모델을 사용하려고 했는데 이방법을 어려울것 같다고 하셔서요 혹시 어떤 형태의 Object Detection 모델이 GPU기반 프로그램에서 Open CV 와 활용했을때 가장 효율이 좋고 쉽게 사용할수 있을까요? 또 전이학습을 통해 .pt 파일이 아닌 .weights 와 .cfg 를 추출하는 방법이 있을까요? 답변부탁 드리겠습니다 교수님..... 감사합니다!
- 미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
YoloV3 pt 모델을 최적화 하는 방법
안녕하십니까 교수님 기존에 custom cata 253장을 사용해 80epochs 학습한뒤 만들 모델이 480MB 정도 되는데요 (개별이미지 크기는 500KB 내외입니다 ) 웹캠을 사용해 돌려보니 컴퓨터 사양 문제도 있겠지만 , 정말 너무 느립니다 향후 웹캠이 아닌 고화질 카메라를 사용할 예정이고, 해당 모델의 고도화도 필요한 상황이라 데이터셋을 3천장정도 확보 해두고 재학습시키려고 하는데 모델을 크기를 결정하는 가장 큰 요소는 무엇인지 궁금합니다 (참고로 클래스는 1개입니다) 모델을 가볍게 만들면서도 성능을 좋게 만드는게 너무 어렵습니다....
- 미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
섹션 10. Ultralytics Yolo 결과물을 python 프로젝트에 적용하는 방법
안녕하세요 교수님 먼저 좋은 강의 감사 드립니다 다름이 아니라 섹션 10. Ultralytics Yolo 실습 부분을 수강하고 Custom 데이터 사용해 학습까지 완료하였는데요 이렇게 나온 best.pt 와 last.pt 파일을 파이썬 open cv 프로젝트에 적용하고 싶습니다 기존에는 cv2.dnn.readNet("yolov3.weights", "yolov3.cfg") 이런식으로. weight 파일과 cfg 파일을 사용하거나 h5 사용하는것만 해보았는데 best.pt 와 last.pt 파일을 로컬에서 사용하는건 참고하기가 어렵더라구요. yolov3 의 detect.py 를 콘솔에서 사용하지 않고 cv2.dnn.readNet("yolov3.weights", "yolov3.cfg") 과 같은 형태로 쉽고 간단하게 사용할수는 없을까요? best.pt 와 last.pt 파일 을 로컬 프로젝트에 적용하는 방법에 대해 참고할수 있는 방법 또는 , 참고자료, 교수님 강의중 참고할수있는 섹션 에 대해 알려주시면 감사하겠습니다!
- 미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
ROI Pooling에서 FC Layer넘어가기
안녕하세요 12분 30초쯤 해서 Feature Map에서 ROI Pooling으로 갈때 depth가 보존되면서 넘어가신다고 하셨는데, 그러면 그다음에 fully connnected layer로 갈때 차원은 3차원으로 넘어가는 건가요..? Dense layer는 1차원으로 펴주어야 들어갈 수 있는것로 알고 있어서요.
- 미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
<mmdetection 관련>
안녕하세요 선생님 강의 잘 듣고 대학원 연구생활에 있어서 많이 도움받고있습니다. 다름이 아니라 수업을 듣던 중 다음과 같은 질문사항이 생겨 질문드립니다. 1. 제가 하려고 하는것은 mmdetection - maskrcnn inference code를 이용하여 inference를 진행한 뒤 추론 결과를 디렉토리에 저장하려고 합니다. 아래 코드와 같이 원본이미지에 추론결과를 덧씌운 결과는 저장에 성공했지만 from mmdet.apis import init_detector, inference_detector, show_result_pyplot import mmcv import torch import cv2 import matplotlib.pyplot as plt #버전 및 gpu 작동확인 print(f"Setup complete. Using torch {torch.__version__} ({torch.cuda.get_device_properties(0).name if torch.cuda.is_available() else 'CPU'})") # config 파일을 설정하고, 미리 학습한 maskrcnn 모델을 checkpoint로 설정. config_file = 'custom_config.py' checkpoint_file = '/Scratch/home/dohyeon/mmdetection/tutorial_exps/epoch_12.pth' # config 파일과 pretrained 모델을 기반으로 Detector 모델을 생성. model = init_detector(config_file, checkpoint_file, device='cuda:0') #디렉토리 내 모든 파일 segmentation 실행 및 저장 path_dir = '/Scratch/home/dohyeon/mmdetection/input/pre-processing/save_point2' file_list = os.listdir(path_dir) for i in range(6): img_name = path_dir + '/' + file_list[i] img_arr= cv2.imread(img_name, cv2.IMREAD_COLOR) img_arr_rgb = cv2.cvtColor(img_arr, cv2.COLOR_BGR2RGB) # cv2.imshow('img',img) fig= plt.figure(figsize=(12, 12)) plt.imshow(img_arr_rgb) # inference_detector의 인자로 string(file경로), ndarray가 단일 또는 list형태로 입력 될 수 있음. results = inference_detector(model, img_arr) # inference 된 결과를 원본 이미지에 적용하여 새로운 image로 생성(bbox 처리된 image) # Default로 score threshold가 0.3 이상인 Object들만 시각화 적용. show_result_pyplot은 model.show_result()를 호출. show_result_pyplot(model, img_arr, results) #추론결과 디렉토리에 저장 model.show_result(img_arr, results, out_file= f'input/pre-processing/save_point3/{file_list[i]}') 제가 원하는 방법은 원본이미지에 추론결과를 덧씌운 show_result_pyplot 과 같은 이미지가 아니라 원본에 덧씌우지 않은 추론결과만을 저장하고 싶습니다. 혹시 좋은 방법이 있을까요? 2. 추론 결과가 mask 형태의 이미지처럼 나오나요? 아니면 배열과 같이 나오나요? 3. 만약 추론결과가 mask형태의 이미지처럼 나온다면 위 그림과 같이 배경 픽셀은 0이고 사람의 픽셀만 0~255 사이의 값으로 나오나요? 이상입니다 감사합니다
- 미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
영상 이미지 Frame FPS 설정 변경 방법 문의
안녕하세요 Yolo 및 Maskrcnn 을 통해 영상을 이미지로 추출을 하려고합니다. 초기 영상 frame을 통해 FPS를 변경을 하려고 합니다. 예를 들면 영상의 초기 FPS가 22FPS로 설정이 되어있는 상태에서 40FPS 또는 10 FPS로 변경 후 영상 이미지를 jpg로 추출이 가능 할까요 ? 방법이 있으시면 가이드 부탁드립니다.
- 미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
안녕하세요 교수님
늦었지만 새해복 많이 받으세요 교수님 :) 다름이 아니라 질문이 있어서 이렇게 글을 남깁니다. 다름이 아니라 albumentation을 업그레이드 하고 import cv가 호출되지 않아서 이렇게 글을 남깁니다. 해결방법을 찾아보는데 나오지가 않아서 ㅠㅠㅠ 감사합니다 :)
- 미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
google open images
강사님 안녕하세요 ! ppt 14p 'object detection의 난제'에서 '데이터 세트의 부족' 부분에서 google open images 500개가 클래스 개수를 의미하는건가요? 그렇다면 600개가 맞지 않나요? 감사합니다 :)
- 미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
ssd grid cell 위치
안녕하세요 선생님, ssd 공부하면서 grid cell 관련하여 궁금한 점이생겨 질문드립니다. image를 SxS 의 크기로 나누는 것을 알겠는데, 나누고 나서 grid cell 점의 위치는 무작위인가요? 제가 보기에는 한 칸의 grid 중심에 한 개의 grid cell이 찍히는 것 같은데 맞는지 궁금합니다. 다른 사람들 블로그를 보면 grid 안에 여러개의 grid cell이 있습니다. 헷갈려 질문드립니다!
- 미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
윈도우 환경에서 주피터 노트북을 실행하고 있습니다.
!cat /VOCdevkit/VOC2012/Annotations/2007_000032.xml 의 명령어가 작동이 되지 않습니다. 'cat'은(는) 내부 또는 외부 명령, 실행할 수 있는 프로그램, 또는 배치 파일이 아닙니다.윈도우 환경이라서 그런것인가요? 그러면 어떻게 해결할 수 있을까요?
- 미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
lambda의 역할
강의 영상 8분에서 apply(lambda x...) 가 나오는데 lambda는 그냥 기준일 뿐인가요? lambda의 역할이 궁금합니다.
- 미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
런타임 관련 질문드립니다.
from mmdet.apis import init_detector, inference_detector import mmcv 를 할때 런타임 다시 시작을 하는데 왜 그래야 하나요..? 설치를 하게 되면 바로 실행이 되어야 한다고 생각하는데, 그렇지 않아서 문의드립니다. 또한 런타임이 어떤 역할을 하는지 알려주시면 감사하겠습니다. +) 커널과 런타임은 같은 개념인가요?
- 미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
mask r-cnn custom data로 학습 하려다가 발생하는 오류 문의드립니다
안녕하세요. 저는 현재 제 custom data로 mask rcnn을 통해 학습을 진행하고자 하고 있습니다. 현재 각 label을 1로 masking한 후, 강의처럼 폴더를 만들어서 진행하였습니다. 그림에는 image가 추가가 안되어 있지만 이후에 추가를 하여서 데이터셋 자체는 잘 구축하였습니다. 각 image당 mask 이미지가 24장 있는 dataset입니다. 이미지 데이터는 이미지와 mask 모두 (512,512) 크기입니다 이후에 순차적으로 coco dataset으로 만들어주고, 코드를 실행하다가 마지막 train_detctor 부분의 에러를 해결하지 못하고 있습니다.. 실행을하고자 하는데 에러가 떠서 그냥 에러 전체를 첨부해보겠습니다. type이 현재 float 형식으로 되어 있는 것 같은데 어디에서 잘못된건지 잘 모르겠어서 이렇게 문의합니다. 감사합니다. ------------------------------------------------------------------------------------------------------------------------
- 미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
label_prefix = self.img_prefix.replace('image_2', 'label_2') 질문
config 설정 기반으로 들어오니 확 어려워지는 감이 있네요. 그래도 열심히 해보겠습니다. 이번 질문은 이렇습니다. label_prefix = self.img_prefix.replace('image_2', 'label_2')에서 굳이 replace로 바꿔줘서 해야하는 이유는 무엇인가요? 그냥 절대 경로를 주어서 넣어도 되지 않나요?
- 미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
mAP 계산 관련하여 궁금증이 있어 질문드립니다
안녕하세요. mAP 관련하여 궁금한 점이 있어 질문드립니다. mAP 계산 방법이 고정되어 있는게 아니라 confidence or iou 둘 중 하나를 기준으로 해서 계산하는 총 두 가지 방법이 있는 건가요 ? 예를 들어서 IoU thres 값을 0.5로 고정 한 뒤 Confidence thres 값을 0.1 ~ 0.9로 변경하면서 얻어지는 precision과 recall curve로 mAP를 계산하는 방법과 Confidence thres 값을 0.5로 고정 한 뒤 IoU thres 값을 0.5 ~ 0.95로 변경하면서 얻어지는 precision과 recall curve로 mAP를 계산하는 방법으로 나뉘어 진다고 생각하면 될까요 ? Pascal VOC의 경우는 전자, MS COCO의 경우는 후자의 계산 방식을 따르고 있는 건가요 ?
- 미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
MMDETECTION 설치 및 MMCV 설치 수행 문의
안녕하세요 이번 강의를 듣게 된 이오규입니다 코랩을 통해 교육을 듣고 있습니다 혹시 ubuntu 환경에서 MMDETECTION 및 MMCV를 설치 후 학습에 이용을 하려고 합니다 설치 관련해서 도움을 받거나 참조 url주소가 있으시면 답변 부탁드립니다
- 미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
현업에서도 패키지를 사용하여 작업을 하나요?
제목 그대로의 궁금증입니다. 대부분의 CV 기업이나 AI 회사들이 스타트업에 가까운데, 이러한 기업들이 패키지를 사용하여 작업하는지 궁금합니다. 실제 제품으로 판매할 때에는 코드로 구현하지만, 연습단계에서는 패키지를 사용하여 구현하는 것인지.. 갑자기 궁금해지네요,