인프런 영문 브랜드 로고
인프런 영문 브랜드 로고

인프런 커뮤니티 질문&답변

Jaewoo Choi님의 프로필 이미지
Jaewoo Choi

작성한 질문수

딥러닝 CNN 완벽 가이드 - TFKeras 버전

EfficientNetB3와 B5 모델 학습 및 성능 평가

이미지 사이즈에 대해 질문드립니다.

작성

·

4.8K

0

강의의 예제들과 비슷하게 이미지들의 가로 세로가 다를 경우 보통은 224, 224로 해주는데 이거에 대한 기준이 있나요? 이미지 사이즈는 제가 임의로 바꿔주면 되는걸까요?

마지막으로 이미지 사이즈가 커질 수록 oom에러가 계속 발생해서 배치사이즈를 줄여주고 있는데 이럴 때 이미지 사이즈를 조절해주면 성능에 영향이 있을까요?

답변 1

1

권 철민님의 프로필 이미지
권 철민
지식공유자

안녕하십니까, 

이미지 사이즈는 임의대로 주셔도 됩니다. 단 딥러닝 Network 모델의 입력 사이즈와 반드시 동일하게 해주셔야 합니다. 

이미지 사이즈는 매우 중요합니다. 보통 이미지가 가로*세로가 다른 경우들이 있습니다. 예제로 사용된 이미지들은 개별적인 가로*세로 이미지들이 각각 다른 경우가 많았습니다. 예를 들어 어떤 이미지는 220 * 400, 어떤 이미지는 312 * 280 이어서 제가 임의로 224x224로 고정했습니다. 물론 딥러닝 CNN 의 대표 모델들이 네트웍 입력 사이즈를 224 * 224로 했기 때문에 이미지 사이즈도 224 * 224로 고정해서 강의를 진행했습니다. 

하지만 만약 모든 이미지 사이즈가 가로와 세로의 크기는 다르지만 가로 * 세로가 동일하다면(예를 들어 224 * 448) 이라면 네트웍 크기도 224 * 448 로 맞추는게 좋습니다. 이때 조심해야 할 사항은 딥러닝 CNN 대표 모델이 특정 숫자의 배수로 된 입력 이미지가 되어야 한다는 것입니다. 가령 가로, 세로 모두 32의 배수가 되어야 한다던가등의 입력 이미지 크기 제약이 있습니다. 이것만 유의해 주시면 됩니다. 

원본이미지의 가로 세로 비율을 그대로(또는 아주 작은 변경, 예를 들어 32의 배수에 가까운수) 네트웍의 입력 이미지를 넣는게 좀 더 성능향상에 도움이 될 수 있습니다. 

그리고 이미지의 크기를 줄이면 OOM을 막는데 도움이 되지만 성능이 약간 저하 될 수 있습니다. 

감사합니다. 

Jaewoo Choi님의 프로필 이미지
Jaewoo Choi

작성한 질문수

질문하기