ROI Pooling 질문 드립니다.

인프런 커뮤니티 질문&답변

navy686

작성한 질문수

[개정판] 딥러닝 컴퓨터 비전 완벽 가이드

Faster RCNN의 이해 01 - Anchor Box

작성

105

- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!
- 먼저 유사한 질문이 있었는지 검색해보세요.
- 강의 내용을 질문할 경우 몇분 몇초의 내용에 대한 것인지 반드시 기재 부탁드립니다.
- 서로 예의를 지키며 존중하는 문화를 만들어가요.
- 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요.

R-CNN에서는 기존의 이미지를 CNN모델에 넣기 위해서 변형을 하다보니깐(warp), 원본의 정보가 훼손될 수 있다고도 하셨는데,

Fast R-CNN에서 Feature Map에서 SS를 매칭시킨 결과를 ROI Pooling에 넣기 위해서 변형하는 것은 F.M의 정보를 훼손 시키지 않는 건가요?

아니면, 훼손되더라도 그 결과가 좋기 때문에 그냥 그렇게 ROI Pooling 사이즈에 일괄적으로 맞추는건가요?

python 머신러닝 딥러닝 keras tensorflow 컴퓨터-비전

답변 1

권 철민

지식공유자

안녕하십니까,

Fast R-CNN은 SPPNET에서 SPP Layer를 ROI Pooling으로 변환한 것이 주요 변경사항입니다.

SPP Layer나 ROI Pooling을 사용하는 이유는 여러개의 원본 이미지들의 사이즈가 서로 다를 경우에 동일한 이미지 크기로 통일해서 학습을 시켜야 하는데, 이럴 경우 원본 이미지의 가로 세로 비율이 달라져서 오브젝트가 원래와 다르게 찌그러지는(?)등의 변형이 발생하여 모델 성능 저하로 이어 질 수 있습니다.

서로 다른 이미지 크기로 만들어진 서로 다른 feature map의 크기로 되어 있는 feature map을 SPP Layer나 ROI Pooling을 통과하면 고정된 사이즈의 vector로 변환 시켜주게 됩니다. 따라서 원본 이미지의 사이즈를 변형할 필요없이 원래 가로 세로 비율로 모델을 학습 시킬 수가 있습니다.

감사합니다.

navy686

작성한 질문수

전체 Q&A

질문하기