inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

딥러닝 CNN 완벽 가이드 - TFKeras 버전

GoogLeNet(Inception) 구조 상세 및 구현 코드 이해

Input Image Size에 대한 질문입니다

1191

gusehd1113

작성한 질문수 1

0

안녕하세요 교수님 강의를 열심히 듣고 있는 학생입니다.
다른게 아니고 input image size를 왜 (224,224)를 쓰는지 궁금합니다. VGG도 그렇고 GoogleNet도 그렇고 왜 224를 쓰는 건가요?
VGG논문을 다 읽어봤지만 그거에 대한 명확한 답을 찾지 못했습니다. 다양한 이미지를 crop하기 위해서 224로 설정했다는 답변을 본적은 있지만 왜 굳이 224인지는 이해하지 못했습니다. 혹시 말씀해주실 수 있을까요?

딥러닝 keras 머신러닝 배워볼래요? tensorflow kaggle cnn

답변 1

1

권 철민

안녕하십니까, 

224 가 추축컨데 AlexNet부터 그렇게 설정을 해와서 그런것 같습니다.  최초 이미지 사이즈는 최종으로 생기는 Feature map의 크기와 학습 시간 사이의 적절한 값을 찾는데, 아마도 AlexNet을 그 기준으로 224를 잡은것 같습니다. 

가령 이미지가 너무 작으면 마지막에 만들어지는 feature map사이즈가 매우 작아지고, 또 너무 크면 학습에 너무 오랜 시간이 소모됩니다. 이런 기준을 가지고 AlexNet에서 224로 초기 이미지 사이즈를 설정하였고, 이후에 많은 모델들이 대부분 224 를 초기 이미지 사이즈로 정한것 같습니다. 

감사합니다. 

0

gusehd1113

좋은 답변 감사드립니다!!

resize 질문

0

50

1

20251212 Kaggle 런타임에 scikit-learn 설치 실패 트러블 슈팅

0

75

1

Loss와 매트릭 관계

0

61

2

Boston 코랩 실습

0

162

2

배치 정규화의 이해와 적용 2 강의 질문

0

134

2

Augmentation원본에 적용해서 데이터 갯수 자체를 늘리는 행위는 의미가있나요?

0

144

2

Conv함수 안에 activation 을 넣지 않는 이유가 뭔지 궁금합니다.

0

203

2

소프트맥스 관련 질문입니다

0

208

1

강의 관련 질문입니다

0

151

2

residual block과 identity block의 차이

0

186

2

옵티마이저와 경사하강법의 차이가 궁금합니다.

1

238

1

실습 환경

0

165

2

입력 이미지 크기

0

243

2

데이터 증강

0

195

2

albumentations ShiftScaleRotate

0

205

1

Model Input Size 관련

0

279

1

마지막에 bird -> frog 말고도 deer -> frog 도 잘못된것 아닌가요??

0

204

1

일반적인 질문 (kaggle notebook사용)

0

272

2

실무에서 Augmentation 적용 시

0

338

2

안녕하세요 교수님

0

231

1

가중치 초기화(Weight Initialization) 질문입니다.

0

327

1

테스트 데이터셋 predict의 'NoneType' object has no attribute 'shape' 오류

0

407

1

학습이 이상하게 됩니다.

2

1036

2

boston import가 안됩니다

0

228

1