작성
·
152
0
안녕하세요 선생님 pretrained 모델 관련 질문이 있습니다.
수업에서 사용했던 faster rcnn, mask rcnn의 pretrained 모델에 대해서 궁금증이 생겼는데요.
backbone모델이랑 .pth모델을 처음부터 학습하면 학습 소요시간이 어느정도 되나요?
ex) .pth모델 -> mask_rcnn_r101_fpn_1x_coco_20200204-1efe0ed5.pth
또한 pretrained 모델을 사용하여 전이 학습을 하면 데이터셋의 크기가 계속 커져도 수용이 가능할지 궁금합니다.
극단적인 예시로 pretrained 모델에 이미지 1억장 이상 학습을 시켜도 성능이 계속해서 좋아질까요?
답변 1
1
1. backbone모델이랑 .pth모델을 처음부터 학습하면 학습 소요시간이 어느정도 되나요?
=>만약에 P100 GPU 카드 한장으로 COCO 학습 데이터를 바닥부터 학습하신다면(해보지는 않았지만 ^^), 2주 이상 걸린다는 얘기를 들은 것 같습니다.
2. 또한 pretrained 모델을 사용하여 전이 학습을 하면 데이터셋의 크기가 계속 커져도 수용이 가능할지 궁금합니다.
=> 데이터 셋트의 크기와 모델의 크기는 상관 없습니다. Feature map의 사이즈는 데이터 세트의 크기와 관계없기 때문입니다. 하지만 이미지 크기가 커지면 수용하는 feature map의 크기가 커지게 되므로 모델의 크기가 커집니다.
3. 극단적인 예시로 pretrained 모델에 이미지 1억장 이상 학습을 시켜도 성능이 계속해서 좋아질까요?
=> 실제 inference는 학습 이미지에서 본게 아닌 유사한 형태의 이미지를 detect 해야 하기 때문에 학습 이미지는 많으면 많을 수록 좋습니다. 하지만 이게 단순히 이미지 갯수만 많아서는 일정 수준 이상은 의미가 없습니다. 다양한 이미지 형태를 가지고 있는게 더 중요합니다. 예를 들어 자동차를 검출한다면 자동차의 비스듬한 면, 뒷면, 정면등 다양한 위치에서의 이미지의 다양한 사이즈의 자동차등, 여러가지 형태를 가진 이미지를 학습 시키는 게 더 중요합니다.
학습 이미지의 갯수도 중요하지만, 그보다 더 중요한 것은 다양한 상황에서 object detect가 될 수 있기 때문에 이러한 환경을 반영한 이미지를 갖추는게 더 중요합니다.
감사합니다.