인프런 커뮤니티 질문&답변

leehoogwan님의 프로필 이미지
leehoogwan

작성한 질문수

[개정판] 딥러닝 컴퓨터 비전 완벽 가이드

TF Hub의 Pretrained 모델을 이용하여 SSD Inference 수행하기 - 01

안녕하세요 교수님!

해결된 질문

작성

·

265

1

딥러닝에 대한 열정적인 강의 정말 잘 듣고 있습니다.

강의를 보면서 실습도 따라가려고 하는데,  pascal voc, ms-coco, opencv, dataset(custom dataset, kitti dataset, etc.) mmdetection 등이 어떤가를 의미하는지 큰 틀에서 이해하고 싶습니다. 

결론은,

1. MMdetection의 구성은 알겠는데, 그냥 알고리즘으로 이해하면 될지 여쭙니다.

2. custom, coco, pascal voc, ms-coco dataset 

이 네가지 모두가 실습을 위해 가져오는 데이터 셋으로 보면 될까요? 그러면 kittitinydataset은 뭔가요?

3. 실습 부분이 이해하기 어려운데, 개념적인 부분을 먼저 듣고 복습하면서 실습부분을 공부해도 될까요? 아님 개념과 실습을 한번에 쭉 가는데 맞을까요?.. 

답변 1

3

권 철민님의 프로필 이미지
권 철민
지식공유자

안녕하십니까,

1. mmdetection은 다양한 object detection 알고리즘을 구현한 패키지 입니다. 예를 들어, faster rcnn 알고리즘을 구현한 다양한 오픈 소스 패키지를 github에서 찾으실 수 있을 것 입니다. mmdetection와 이와 같은 패키지 이지만, 매우 성능이 뛰어나고 다양한 object detection 알고리즘들을 구현한 패키지 입니다. 

2. object detection 알고리즘들을 테스트 해보기 위한 다양한 데이터 세트가 있습니다.  초창기에는 Pascal Voc 데이터 세트가 자주 사용되었습니다. 왜냐하면 PASCAL VOC Object Detection Contest에서 사용된 데이터 세트이기 때문입니다. 이후에는 보다 대용량의, 어려운 데이터 세트가 나왔는데, 대표적으로 ms-coco dataset이 있습니다. ms coco 데이터세트는 pascal voc보다 많은 오브젝트들, 특히 작은 오브젝트들을 가지고 있는 이미지들이 많아서 보다 실전에 가까운 데이터 세트입니다. 

object detection 영역이 각광을 받으면서 이외에도 여러가지 데이터 세트들이 open 소스 형태로 나오게 됩니다. oxford pet 데이터세트, google open image등, 그리고 kitti 데이터 세트는 기초적인 자율주행 분야에서 보행자, 자동차, 자전거등을 검출하기 위해 만들어진 데이터 세트입니다. 

여기서 custom 데이터 세트란 자신만의 object detection 모델을 만들기 위해  사용되는 데이터 세트를 의미하는데, 일반적으로 많은 object detection 패키지들이 ms-coco dataset으로 이미 학습된 모델을 제공합니다. 이 경우 ms-coco의 80개 class 외에는 object를 detect 할 수 없습니다.  그래서 이미 학습된 모델이 아닌, 자신 만의 데이터 세트, 즉 ms coco가 아닌 다른 class를 detect 하기 위한 데이터 세트를 의미 합니다. 

3. 실습이 어려우시면 이론을 먼저 들으시고, 실습을 수행해 보시기 바랍니다. 어렵다고 바로 거기서 멈추지 마시고, 몇번 더 앞까지 들으신다음에, 다시 복습을 하셨으면 합니다. 

감사합니다. 

leehoogwan님의 프로필 이미지
leehoogwan
질문자

감사합니다 교수님!

확실한 이해를 위해 질문드립니다.

1. 그러면 mmdetection은 다양한  object detection 알고리즘들을 가지고 있는 패키지라고 보면 될까요?

2. Custom dataset는 딱 정해졌다기 보다 특정 object detection model에 따라서 선택되는 테이터 셋을 의미하는 건가요? -> Ms-coco의 80개 외의 class들을 구별하기 위해 실습에서 다른 데이터 셋(kitti, Oxford)을 이용하신건가요?

너무 기본적인 질문이라 죄송합니다.

구글링을 해도 전체적인 감이 안잡혀서 질문했습니다.

성의 있는 답변 정말 감사합니다.

권 철민님의 프로필 이미지
권 철민
지식공유자

네 두가지 다 맞습니다

leehoogwan님의 프로필 이미지
leehoogwan
질문자

감사합니다!

leehoogwan님의 프로필 이미지
leehoogwan

작성한 질문수

질문하기