월 24,200원
5개월 할부 시다른 수강생들이 자주 물어보는 질문이 궁금하신가요?
- 미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
backbone 바꾸기
- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 서로 예의를 지키며 존중하는 문화를 만들어가요. - 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요. 안녕하세요 강사님 강의 잘 듣고 있습니다. 몇가지 질문이 있어서 질문드립니다. 만약에 backbone을 바꾸고 싶으면 이와 같이 하면 되나여 ..? 백본을 바꾸난 뒤 init_cfg에있는 checkpoint도 바꾸어야 되는지 궁금합니다.
- 미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
mAP 계산하려면?
선생님, 안녕하세요? YOLO 결과를 받아서 mAP를 계산하려고 합니다. 그럴려면 강의에서 말씀하신 것처럼 모든 confidence에 대한 결과로 PR 그래프를 그려야 하니까 예측 결과를 구할 때 confidence_thres=0.001로 낮게 해야 하죠? 그리고 일반적인 예측시에는 confidence_thres=0.4처럼 정해서 원하는 정확도와 재현율을 찾구요. 그리고, No mask와 Mask가 박스로 동시에 예측하는 경우가 있는데, 제가 알기로는 NMS에서 겹치는 박스시에는 제거하는 걸로 아는데, 그것은 동일 클래스인 경우에 해당되는 개념인가요? 제 생각이 맞는지 부연 설명 좀 부탁드립니다.
- 미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
어떤 논문인가요?
선생님 안녕하세요, 강의를 상황상 앞에서부터 못 듣고 SSD에 대한 학습이 필요해 이 부분을 먼저 들었는데요, 그래서 모를지도 모르는데.. 혹시 말씀 중 참고하셨다 언급하신 '논문'이 어떤 논문인가요?
- 미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
안녕하세요 선생님!
선생님의 딥러닝 CNN강의를 보고 이 쪽 분야에 관심이 생겨 공부하고 있는 학생입니다. 강의를 보다 직접 object detection 모델을 만들고 휴대폰 애플리케이션에 탑재해보고 싶다는 생각이 들어 공부하고 있던 중 궁금한 점이 생겨 질문 드립니다. 먼저 제가 만들고 싶은 모델은 여러종류의 음식을 사진을 통하여 detection 할 수 있는 모델입니다. 해당 모델을 yolo계열을 사용할지 RCNN계열을 사용할지 고민입니다. 실시간 객체 검출이 목적이 아닌 사진에서의 검출이라 yolo보단 RCNN이 맞을 것 같은데, 선생님의 의견을 듣고싶습니다.
- 미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
yolov5 관련하여 질문이 있습니다.
1. yolov5를 이용해서 키보드 입력이 되면 다른 화면이 보여지게 하고싶습니다. 예들들어 key = cv2.waitKey(1) & 0xFF if key == ord('a'): 블라블라 이렇게 하고 싶은데, yolov5의 경우 키보드 입력값(어떤 값이든) 이 들어가면 프로그램이 종료되버립니다. 2. 80 클래스를 가진 coco dataset에 제가 추가적으로 class를 추가하여 pt파일을 만들고 싶습니다. 찾아보니까 전이학습을 하면 된다고 하는데, 하는방법을 모르겠습니다. ㅠㅠ
- 미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
RCNN Training
4분 31초분경에 FC layer를 통과하면 feature map이 만들어진다고 하셨고, 이를 SVM으로 학습시킨다고 설명해주셨는데요 ground truth로만 학습하고, class를 ground truth 기반으로 정하신다고 말씀하셨는데 여기서 IOU를 무엇과 계산하는건가요? 이전에 제안된 SS predicted와 IOU를 계산하는건가요? 아니면 FC layer를 통과한 feature map과 계산하는건가요?
- 미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
Yolo v2
안녕하세요 Yolo v2에 대해서 몇가지 질문드리고 싶어서 글 남깁니다. 1. Direct Location Prediction 에서 여기서 tw와 th가 학습을 통해서 적절한 값을 향하는걸로 이해했습니다.그러면 그 값은 클래스마다 어떤 하나의 값으로 수렴되는게 아닌것같은데.. 예를 들어 Car라는 클래스의 bbox를 예측하고 정답과 비교하며 학습한다고 했을때t값을 예측하고, 그 값을 넣은 b값과, 정답을 비교하고 옳은 t값을 구하고 나서의 일들이 헷갈립니다. 저 t값을 위해 아주 많은 노드들의 가중치값이 조금씩 변화하다 보면 Car라는 클래스의 bbox크기를 점점 더 잘 맞추게 되는건가요? 전체적인 매커니즘이 잘 이해가 되지 않아서 질문 드립니다. 2. 논문에서 자세히 밝히지 않아 질문드립니다. 앵커박스를 mAP 70이상들은 쓰지 않았는데 왜 굳이 쓰지 않은건가요?yolov2에서 바뀐것들중 큰 부분이라고 생각했는데 결국에 쓰지 않는것인지.. 이해가 잘 되지않습니다. 또한, 앵커박스를 쓰지 않았으면 yolov1과 같은 방식으로 2개의 box를 이용했다는것인지 궁금합니다.
- 미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
mmdetection segmentation 모델로 object detection 학습
mmdetection의 detectoRS로 object detection을 해보고자 하는데 detectoRS(HTC + ResNet-101)는 segmantation에 사용되는 모델이라 config값에 추가적인 값들이 있는 것 같습니다. 이럴 때는 config에서 mask관련 설정은 모두 없애고 학습해야되나요? config를 어떻게 건드려야 할지 잘 모르겠습니다.
- 미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
json convert 질문입니다.
안녕하세요..? 깅사님 그 혹시 데이터 셋이 png 이미지랑 mask 이미지 밖에 없습니다. ann 파일이 전혀 없습니다. 그래서 json 파일을 만들어야 하는데 혹시 만드는 방법이나 참고할 만한 자료가 있을까요 .. ? ㅠㅠ
- 해결됨[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
custom dataset을 생성할 때 annotation 관련 질문
강사님 안녕하세요! 특정 장애물(바위)을 detect 하기 위해서 CVAT 툴을 이용해 custom dataset을 생성하려고 합니다. 1. 학습을 위한 이미지 내의 모든 장애물들을 모두 annotate하지 않고 일부 개수만 annotate 하게 되면 annotate 되지 않은 것들 때문에 학습에 악영향을 끼칠 수 있을까요? 2. 그리고 이 장애물만 detect 하면 돼서 클래스 1개로 학습을 진행하려 하고 있는데, 클래스 수를 늘린다고 해서 학습 성능이 더 좋아질 가능성도 혹시 이론적으로 있나요? 유익한 강의 감사드립니다!
- 미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
confidence 질문드립니다.
confidence에 대해 질문드립니다. 저는 confidence를 단순히 softmax로 나온 결과값으로 해석했는데..이는 너무 1차원적인건가요? 또한 이렇게 해석하는 것이 옳은건가요?
- 해결됨[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
안녕하세요 ..?
안녕하세요 ..? 강사님 질문이 있습니다. 지금 현재 mmdet을 개인 로컬 리눅스 환경에서 학습하고 인퍼런스 하고 있습니다. 다만, 궁금한것이 mmdet으로 학습을 완료한 cofig 파일과 check pont 파일을 torch나 keras같은 것으로 load해서 윈도우 상에서 inference가 가능한지 궁금합니다 ㅠ
- 미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
automl 질문드립니다
안녕하세요 강의 너무 잘 듣고있습니다 제가 비전공자인데 제 데이터에 적용하려니 어려움이 크네요... 다름이아니라 autiml에서 데이터셋이 jpg가 아닌 png파일일때는 어떻게 적용하는지 알 수 있을까요? import hashlib import io import json import os import PIL.Image import tensorflow as tf from dataset import tfrecord_util # 1개의 image 파일 PATH와 1개의 annotation XML 정보를 가지는 data dic를 이용하여 tf.train.Example를 생성. def dict_to_tf_example(data, image_path, label_map_dict, unique_id, ignore_difficult_instances=False, ann_json_dict=None, debug=True): ''' data는 1개의 xml 파일을 dictionary로 변환 anno_dict, image는 1개의 xml에 매핑되는 image 파일의 절대 경로 unique_id는 고유한 image와 object id를 만들기 위한 Unique_Id객체 ''' #JPEG image를 binary 그대로 읽음. with tf.io.gfile.GFile(image_path, 'rb') as fid: encoded_jpg = fid.read() # image가 JPEG 타입인지 확인. encoded_jpg_io = io.BytesIO(encoded_jpg) image = PIL.Image.open(encoded_jpg_io) if image.format != 'JPEG': raise ValueError('Image format not JPEG') # image의 고유 key값 생성. key = hashlib.sha256(encoded_jpg).hexdigest() #고유한 image id를 생성. image_id = unique_id.get_image_id() # image의 width와 height 가져옴. width = data['width'] height = data['height'] jpg 파일을 읽어서 바이너리로 출력하는데 png파일을 넣으면 이상한 값이 나오는것같아 질문합니다!
- 미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
Object Detection에서 TP, FN 질문드립니다
Object Detection에서 TP, FN 질문드립니다 강의에서 wrong class로 예측한것은 FP no prediction은 FN이라 하셨는데 wrong class로 예측한게 FN으로 해야하는거 아닌가요? (wrong class러 예측한게 FN이나 FP 둘다 가능한거 아닌가요..?)) 헷갈리네요 ㅜㅜ
- 미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
공부 방향 설정 문의드립니다
항상 강의 잘 듣고있습니다! 다름이아니라 곤충 개체 인식관련한 오브젝트 디텍션을 수행하고싶은데, 어떤 모델을 사용하는게 좋을지 여쭤보고싶습니다. 곤충이 한마리만 혹은 다수의 개체가 찍힐 수 있게 영상 촬영 장치를 거치해 두고 곤충이 특정 행동을 했을때 알림을 주는 시스템을 만들고 싶은데요, 강의를 들으면서 Efficient Det을 사용하는게 좋을지 다른 모델을 사용해야좋을지 잘 모르겠어서 질문드립니다. 어노테이션부터 일일히 해야하는데 이런경우 어떤 모델을 사용하는게 좋을까요? 찾아보니 이쪽 분야에서는 Yolo를 많이 사용한다고하긴했지만 정확히 모델간의 차이점이 얼마나 크고 작은지 감이 안잡히네요 ㅠㅠ
- 미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
ssd 학습 결과 궁금증
안녕하세요 선생님, SSD 모델로 학습을 진행하고 있는데 생각보다 오탐지(false positve?)가 너무 많이 잡히고 있습니다. yolo에서는 이렇게 잡히지 않았는데... 이유가 궁금하여 지금 학습하고 있는 config file을 길지만 올렸습니다..(죄송합니다) tensorflow의 ssd를 사용했습니다. mmdetection을 사용하면 결과가 또 다르게 나올까요?? focal loss하고 hard example miner 둘 다 확인해봤습니다. focal loss도 똑같이 오탐지를 하면서 단지 학습의 확신을 주는 느낌으로 밖에 안 느껴졌습니다.!!
- 미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
CVAT의 Task에 Job 추가하는 방법이 있습니까?
안녕하세요? 선생님 CVAT로 객체검출 레이블링을 하려고 CVAT를 사용하고 있습니다. 설치방법이 까다로워 느리지만 웹기반으로 사용중입니다. 이미지를 조금씩 업로드해서 작업하려고 하는데, 기존의 이미지의 레이블링 작업이 끝나서 다음 작업으로 넘어가려고 하는데, (Task에 Job을 추가하면 될 것 같은데?) 메뉴도 버턴도 찾을 수가 없습니다. 최약의 경우 다시 Task를 정의하면 되겠지만, 그러면 많이 불편할 것 같습니다. 좋은 방법이 있을까요? 그럼 오늘도 좋은 하루 되십시오 감사합니다.
- 해결됨[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
Selective search 질문
spp net을 rcnn에 적용할 때 selective search 를 feature map에 matching?한다고 표현하셨는데, Selective search가 objects를 찾는 거고, 이 objects들을 feature map에 매칭한다는게 정확히 어떤 의미인지 모르겠습니다.
- 미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
mAP해석
안녕하세요 강사님. 제가 다른 데이터셋을 이용해서 학습을 시켜봤는데 결과가 이런식으로 정확도(acc)는 매우 높고 loss는 매우 낮게 나왔습니다. 이후에 자동으로 이 과정을 통해서 자동으로 validation을 한거 같은데 결과가 이렇게 정말 ap값이 매우 낮게 나옵니다. 데이터 갯수도 모두 50개 이상인 클래스들만 전처리하여 학습을 시켰습니다. 사용한 데이터셋의 그림상에서 object의 크기가 매우 작기는 합니다. 하지만 학습 epoch에서는 정확도와 loss가 매우 좋게나왔는데 왜 갑자기 개별 object의 ap들은 형편없는 값이 나오는지 모르겠습니다... #추가로 middle format으로 모델을 evaluate할 수 있는 방법이 있을까요?? test.py파일에서 지원하는 evaluate는 coco랑 voc형태의 데이터구조일 경우 옵션 인자만 적혀있어서 middle format인 경우는 어떻게 하는지 궁금합니다..! 감사합니다!
- 미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
ultralytics에서 yolov3 x/lr 의미가 무엇인가요?
안녕하세요 oxford-pet wandb로 결과를 보면서 lr에 대해서 저렇게 아래처럼 분류되어있는데 lr0, lr1은 똑같이 보이는데, 왜 3개로 나뉘어져 있는건가요? 감사합니다