인프런 영문 브랜드 로고
인프런 영문 브랜드 로고

인프런 커뮤니티 질문&답변

guentc1님의 프로필 이미지
guentc1

작성한 질문수

딥러닝 CNN 완벽 가이드 - TFKeras 버전

scaled yolov4 질문있습니다.

작성

·

616

0

선생님 안녕하세요. yolov4 cfg 파일 안에 yolov4x-mish와 yolov4-csp 두 개 모델이 있는 것을 확인했습니다. 그리고 찾아보니까 scaled 기법? 을 바탕으로  yolov4에서 변형 된 것이 mish와 csp 모델인지..  아닌지 두 모델에 대해 정확하게 잘 모르겠어서 여쭤봅니다.

추가.

yolov4x-mish  구조를 확인하면, activation(활성화함수)에서 leakly relu 대신에 mish를 더 많이 사용하는 것을 확인할 수 있었습니다. 그래서 활성화 함수만 mish를 사용했나 했지만,  yolv4x-mish 코드 길이? 구조가 더 긴 것을 확인할 수 있었습니다.

yolov4-csp를 찾아보니까, cross stage partial netwrok를 사용한듯합니다.

항상 감사드립니다.

제가 아직 구조를 잘 모르다보니까.. 이렇게 질문을 드립니다.

답변 1

1

권 철민님의 프로필 이미지
권 철민
지식공유자

안녕하십니까,

음, 제가 Yolo v4와 Scaled Yolo v4를 소스코드를 뜯어볼 정도는 아직 공부하질 못했고, 대략적으로 알고 있는 것만 말씀드리면,

Yolo v4의 경우 Activation으로 Mish를 주로 적용하고, Backbone을 CSP(cross stage partial netwrok) Darknet을 적용합니다.

Yolo v4 이후에 다시 Scaled Yolo v4가 나오게 되는데, Scaled Yolo v4는 efficientnet과 유사하게 네트웍의 깊이, 너비, 이미지 resolution을 scale별로 최적화 시키는 네트웍을 만들어 냅니다. 이때 CSP Backbone 뿐만 아니라 FPN Neck 역시 scale별로 최적화 시켜서 네트웍을 만들어 냅니다. Scaled Yolo v4의 주요 장점은 기존 Yolo v4 네트웍을 scaling 시켜서 Yolo v4-P5, P6, P7 과 같이 속도와 성능의 Balance를 맞춘 네트웍을 만들어 낸것입니다.

yolov4x-mish.cfg의 yolov4-csp.cfg와 정확히 뭐가 다른지는 확실하지는 않지만, 말씀하신 대로 residual block level로 backbone 생성시 mish activation 이 yolov4-csp.cfg보다는 더 많이 사용된것 같습니다. 코드는 제가 살펴보지 못했습니다. 코드 URL을 함 올려봐 주시지요.

마찬가지로 Scaled Yolov4가 yolov4x-mish.cfg 또는 yolov4-csp.cfg중 어떤걸 변형해서 만들었는지도 잘 모르겠습니다. 하지만, yolov4x-mish는 단순히 activation이 mish로 더 많이 적용되었다는 차이정도만 있는 것 같습니다. 이런 기준에서 이들중,  어떤 config가 scaled yolov4가 기반으로 가지는지, 크게 의식할 필요는 개인적으로 없다고 생각됩니다만, 결국은 원하시는 걸 확인하려면, 소스코드를 더 뜯어봐야 하는 수밖에 없는 것 같습니다.

해당 질문은 내용상, 여기 강의 보다는 딥러닝 컴퓨터 비전 완벽 가이드 강의 게시판에 올려 주시는게 좋을 것 같습니다.

guentc1님의 프로필 이미지
guentc1
질문자

넵!! 다음 번에는 구별해서 강의 게시판에 올리겠습니다.

감사드립니다.

guentc1님의 프로필 이미지
guentc1

작성한 질문수

질문하기