• 카테고리

    질문 & 답변
  • 세부 분야

    컴퓨터 비전

  • 해결 여부

    미해결

mmdetection pipeline에서의 resize scale에 대해서 질문이 있습니다

21.07.26 20:41 작성 조회수 519

0

안녕하세요 'Config의 이해 Data Pipeline` 강의에서 질문이 있습니다

데이터 파이프라인에서 resize의 img_scale로 모든 이미지를 resize 한다는 것인가요? 굉장히 큰 사이즈로 reshape를 하길래, 혹시나 해서 궁금해서요

그리고 keep_ratio를 유지하면 남은 여백에 대해서는 검은색으로 padding을 한다는 것인가요?

+ 추가로 아래와 같은 pipeline을 봤는데 ,이때는 img_scale이 2가지가 있는데, 그럼 이때는 두 사이즈로 모두 rescale 되어서 하나의 이미지가 2개의 image로 augmentation 개념으로 변형되어서 입력으로 들어가는 형태인거죠?

train_pipeline = [
    dict(type='LoadImageFromFile'),
    dict(type='LoadAnnotations', with_bbox=True),
    dict(type='Concat', template_path=data_root + 'template_Images/'),
    dict(
        type='Resize',
        img_scale=[(3400, 300), (3400, 500)],
        multiscale_mode='range',
        keep_ratio=True),
    dict(type='RandomFlip', flip_ratio=0.5),
    dict(type='Normalize', **img_norm_cfg),
    dict(type='Pad', size_divisor=32),
    dict(type='DefaultFormatBundle'),
    dict(type='Collect', keys=['img', 'gt_bboxes', 'gt_labels']),
]

답변 2

·

답변을 작성해보세요.

0

유영재님의 프로필

유영재

질문자

2021.07.27

안녕하세요 직물 결함 검사 코드에서 봤었는데, 궁금해서 질문을 드렸습니다

https://github.com/zhengye1995/Tianchi-2019-Guangdong-Intelligent-identification-of-cloth-defects-rank5/blob/master/config/fabric_defect/cascade_rcnn_r50_fpn_400.py

감사합니다

0

안녕하십니까, 

네 img_scale이 있으면 해당 size로 이미지를 키워서 입력합니다. mmdetection은 보통 이미지를 크게 키워서 입력합니다. 

keep ratio는 원본 이미지를 img_scale로 늘릴때 원본 이미지의 가로/세로 비율을 유지하기 위해서 비율이 모자라는 영역을 검은색으로 padding을 채웁니다. 

음, 첨부해주신 pipeline config는 어떤 모델에서 가져오신 건지요? 저도 2개의 img_scale은 처음 보는것 같습니다.