인프런 영문 브랜드 로고
인프런 영문 브랜드 로고

인프런 커뮤니티 질문&답변

jw k님의 프로필 이미지
jw k

작성한 질문수

[개정판] 딥러닝 컴퓨터 비전 완벽 가이드

RetinaNet의 이해 - Feature Pyramid Network

에어리얼 스페이싱? 이 뭔가요

작성

·

305

0

Ratinanet의 FPN 강의를 듣고 있었습니다.

 

각 구간별 피처맵에서 UPSapleing하여 더해준 후 3X3 covolution 연산을 해준다고 들었는데 그 후 3X3 convolution 연산을 하는 이유가 에어리얼 스페이싱 때문이라는 거 같은데 이게 맞는건지 여쭙고 싶습니다.

답변 2

1

권 철민님의 프로필 이미지
권 철민
지식공유자

안녕하십니까,

제가 에어리얼 스페이싱 때문이라고 언급드린 부분이 있는지요? 강의의 몇분 몇초에서 그런건지 확인 부탁드립니다.

감사합니다.

jw k님의 프로필 이미지
jw k
질문자

RatinaNet의 이해 Feature Pyramid Network

10분 15초 부터 입니다.

권 철민님의 프로필 이미지
권 철민
지식공유자

10분 15초에서 aliasing effect를 말씀드립니다(아마 제가 영어 발음이 안좋아서 그렇게 들리신것 같습니다 ^^)

aliasing 현상은 일반적으로 신호처리시에 downsampling을 적용할 때 성능이 저하되는 현상을 의미합니다. 딥러닝에서는 Maxpooling이나 1x1 conv를 적용전 feature map보다 적은 채널수로 적용을 할때 성능 저하가 발생할 수 있는데, 이를 aliasing 현상이라고 합니다.

FPN에서는 원본 feature map을 적은 채널수로 1x1 conv 적용한 것과 Upscale을 적용한 feature map을 서로 더합니다. 이때 bottom으로만 만들어진 feature map의 채널 수 보다 적은 채널을 upscale feature map에 적용하므로 aliasing 현상이 발생할 수 있는데, 해당 강의 영상에서는 이를 좀 더 개선하기 위해 이 후에 더 많은 채널수를 가지는 3x3 conv를 적용하는 것을 말씀드리고 있습니다.

0

jw k님의 프로필 이미지
jw k
질문자

아 그렇군요 답변 감사합니다!

jw k님의 프로필 이미지
jw k

작성한 질문수

질문하기