작성
·
661
0
안녕하세요 'Config의 이해 Data Pipeline` 강의에서 질문이 있습니다
데이터 파이프라인에서 resize의 img_scale로 모든 이미지를 resize 한다는 것인가요? 굉장히 큰 사이즈로 reshape를 하길래, 혹시나 해서 궁금해서요
그리고 keep_ratio를 유지하면 남은 여백에 대해서는 검은색으로 padding을 한다는 것인가요?
+ 추가로 아래와 같은 pipeline을 봤는데 ,이때는 img_scale이 2가지가 있는데, 그럼 이때는 두 사이즈로 모두 rescale 되어서 하나의 이미지가 2개의 image로 augmentation 개념으로 변형되어서 입력으로 들어가는 형태인거죠?
train_pipeline = [
dict(type='LoadImageFromFile'),
dict(type='LoadAnnotations', with_bbox=True),
dict(type='Concat', template_path=data_root + 'template_Images/'),
dict(
type='Resize',
img_scale=[(3400, 300), (3400, 500)],
multiscale_mode='range',
keep_ratio=True),
dict(type='RandomFlip', flip_ratio=0.5),
dict(type='Normalize', **img_norm_cfg),
dict(type='Pad', size_divisor=32),
dict(type='DefaultFormatBundle'),
dict(type='Collect', keys=['img', 'gt_bboxes', 'gt_labels']),
]
답변 2
0
안녕하세요 직물 결함 검사 코드에서 봤었는데, 궁금해서 질문을 드렸습니다
https://github.com/zhengye1995/Tianchi-2019-Guangdong-Intelligent-identification-of-cloth-defects-rank5/blob/master/config/fabric_defect/cascade_rcnn_r50_fpn_400.py
감사합니다
0
안녕하십니까,
네 img_scale이 있으면 해당 size로 이미지를 키워서 입력합니다. mmdetection은 보통 이미지를 크게 키워서 입력합니다.
keep ratio는 원본 이미지를 img_scale로 늘릴때 원본 이미지의 가로/세로 비율을 유지하기 위해서 비율이 모자라는 영역을 검은색으로 padding을 채웁니다.
음, 첨부해주신 pipeline config는 어떤 모델에서 가져오신 건지요? 저도 2개의 img_scale은 처음 보는것 같습니다.