• 카테고리

    질문 & 답변
  • 세부 분야

    컴퓨터 비전

  • 해결 여부

    미해결

섹션3-RCNN의 이해 02-> F.E에서 IoU 0.5이하로 fine tuning 했는데 SVM에서 IoU 0.3이하로 다시 fine tuning이 필요한가요?

23.05.20 15:58 작성 23.05.20 16:00 수정 조회수 304

1

안녕하세요-

섹션 3 RCNN의 이해 02 강의에서 강의노트 중

RCNN Training - Classification 제목의 강의안에서 질문드립니다.

 

F.E에서 Ground Truth와 SS Predicted된 영역 IOU가 0.5 이상인 경우만 해당 클래스로, 나머지는 back ground로 fine-tuning했는데

 

SVM Classifier에서 Ground Truth로만 학습하되 0.3 IOU이하는 Background로 설정하는 방식을 병행하는 이유가 있는지 궁금합니다!

 

  1. 처음부터 F.E에서 IOU를 0.3으로 설정하는 방법도 있었을텐데.. 2단계로 나눠서 순차적으로 IOU를 낮추는 게 어떤 차이가 있는지 궁금합니다!

  2. F.E에서 IOU가 0.5 이상인 이미지만 filtering했는데 SVM에서 0.3 이하인 image가 남아 있을 수 있는 건 지, 제가 이해를 잘 못한 건지도 여쭤봅니다!

답변 2

·

답변을 작성해보세요.

1

와우, 인프런 AI 인턴이 누구시죠?

설마, ChatGPT 인가요? 그렇다면 놀랍군요. 이런 어려운 기술적인 질문에 이 정도 뛰어난 수준의 답변을 주다니...

암튼 제 답변은 아래와 같습니다.

F.E가 딥러닝 모델 layer를 의미하신거죠?

논문에서도 왜 딥러닝 모델 단은 iou가 0.5이하를, SVM에서는 IOU가 0.3 이하를 Background로 간주하는지 명확하지는 않습니다(저도 추측만 할 뿐입니다)

제 생각엔 실험적으로 다양한 방식을 적용해 보았는데, 그 중에 최적 성능이 나온 방식이 위 방식이라고 생각합니다. 딥러닝 모델과 SVM 모델이 따로 있는 방식이라 좀 더 분리된 여러가지 다양한 방식을 적용해보면서 찾은 경험적인 결과라고 생각됩니다.

감사합니다.

0

인프런 AI 인턴님의 프로필

인프런 AI 인턴

2023.05.21

안녕하세요, 인프런 AI 인턴이에요.

RCNN Training - Classification 강의에서 F.E에서 IoU 0.5 이상인 이미지만 해당 클래스로 나머지는 배경으로 fine-tuning 하는 방식을 사용하고, SVM에서는 Ground Truth와 IoU가 0.3 이하인 이미지는 배경으로 설정하는 이유는 두 가지가 있습니다.

첫 번째 이유는 F.E에서 IoU를 0.3으로 설정하면, 아직 높은 IoU를 가진 이미지 중에서도 잘못된 학습 데이터가 생성될 수 있기 때문에 0.5 이상을 설정하고 학습하는 것이 좋습니다. 두 번째 이유는 SVM에서는 F.E에서 filtering되지 않은 Ground Truth와 IoU가 0.3 이하인 이미지를 배경으로 설정하여 학습하면 더 좋은 성능을 얻을 수 있기 때문입니다.

따라서, F.E에서 IoU 0.5 이상으로 filtering하고 SVM에서 Ground Truth와 IoU 0.3 이하인 이미지를 배경으로 설정하는 것이 더 나은 성능을 얻을 수 있는 방법입니다. 추가적인 fine-tuning은 필요하지 않습니다.

감사합니다.

질문을 좀 더 간단하게 만들어보려고 노력해봤어요. AI 인턴님과 잘 소통이 되었으면 좋겠네요.

제가 궁금한 건, RCNN의 F.E에서 IoU 0.5이하를 background로 학습했는데, SVM Classifier에서 IoU 0.3이하를 background로 다시 학습하는 이유입니다!

와우, 인프런 AI 인턴이 누구시죠?

설마, ChatGPT 인가요? 그렇다면 놀랍군요. 이런 어려운 기술적인 질문에 이 정도 뛰어난 수준의 답변을 주다니...

암튼 제 답변은 아래와 같습니다.

F.E가 딥러닝 모델 layer를 의미하신거죠?

논문에서도 왜 딥러닝 모델 단은 iou가 0.5이하를, SVM에서는 IOU가 0.3 이하를 Background로 간주하는지 명확하지는 않습니다(저도 추측만 할 뿐입니다)

제 생각엔 실험적으로 다양한 방식을 적용해 보았는데, 그 중에 최적 성능이 나온 방식이 위 방식이라고 생각합니다. 딥러닝 모델과 SVM 모델이 따로 있는 방식이라 좀 더 분리된 여러가지 다양한 방식을 적용해보면서 찾은 경험적인 결과라고 생각됩니다.

감사합니다.