작성
·
254
0
안녕하세요. 좋은 강의 덕분에 많이 배우고 있는 학생입니다.
Ground Truth와 관련되어 이해가지 않는 게 있어 질문드립니다. Anchor box를 이진분류로 Positive와 Negative를 판단한다고 하셨는데, 이는 Ground Truth를 통해 신경망처럼 가중치를 최적으로 변경해 나가는 방식이라고 생각합니다. 그렇다면 가중치를 최적으로 바꾸기 위해 모든 Object에 대해 라벨링이 돼있어야 하는데 이런 이미지 데이터는 모든 Object에 대해 라벨링 돼있고 그걸 이용해서 최적의 가중치를 찾아나간다는 말씀이신지 궁금합니다.
만약 모든 Object에 대해 라벨링이 돼있어서 학습이 가능하다면, 이렇게 제공되는 COCO, PASCAL 같은 이미지셋 말고 개인이 크롤링한 이미지에선 Object Detection 학습이 힘든지도 궁금합니다.(라벨링면에서)
감사합니다.
답변 2
1
안녕하십니까,
1. 네 맞습니다. 이미지의 object에 대해서 bounding box 좌표값과 classification 라벨링을 순차적으로 예측 오류값을 보정해 나가는 학습과정을 통해 최적의 가중치를 찾고 이를 기반으로 object detection 을 수행하게 됩니다.
2. 개인이 크롤링한 이미지는 bounding box 만들기가 어렵습니다. coco나 pascal 모두 사람 손으로 툴(예를 들어 labelIMG)을 이용하여 bounding box 와 라벨링을 하였습니다. 하루에 한 사람이 300개 이상 만들기 어렵습니다(제가 해봤습니다 ^^;;).
머신러닝은 데이터가 생명입니다. 멀티 object detection에는 많은 이미지 bbox와 라벨링이 필요한데, 개인이 툴을 이용하더라도 이를 만들기가 어렵습니다. 해당 작업은 보통 외주를 준다거나(요새 데이터 바우처 사업이 있습니다만)해서 만들어야 되는데 돈이 상당히 투자가 되어야 합니다. 이런 측면에서, 즉 데이터를 준비하는 측면에서 어려운거지, 이런 부분만 잘 준비 된다면 Object Detection이 어려울게 없습니다.(물론 데이터 준비하는게 제일 어렵습니다)
감사합니다.
0
세세한 답변 감사합니다.
Kaggle같은 짜여진 이미지셋말고 크롤링하며 Object detection 모델과 classification을 학습시켜 보려했는데 본 강의가 정말 큰 도움이 되고 있습니다.
감사합니다.