inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[개정판] 딥러닝 컴퓨터 비전 완벽 가이드

RCNN의 이해 01 - Region Proposal 기반의 Object Detection 모델

detection 과정 질문

267

HAHA

작성한 질문수 52

0

안녕하세요.

제가 이해를 못한 부분이 있어서 질문드립니다.

 

1.

과정이

a. region proposal로 RoI 2000개 추출

b. 2000개의 각 이미지들은 따로 feature extractor에 입력

c. feature extractor에서 feature map 추출

d. feature map -> 1D로 추출

e. FC Layer 에서 확률 추출

맞나요??

혹시 제가 잘못 이해했다면, 알려주시면 감사하겠습니다!

 

-----

2. 

1-c. 과정에서 feature map이 뭔지 잘 모르겠습니다

각 이미지에서 feature extractor를 추출한다는게 

사람으로 예를 들자면 눈과 같은 특징들을 추출한게 feature map이라고 보면 될까요??

 

---

3.

1-d. e. 과정에서 1D -> FC Layer에 입력이 무엇을 하는지 잘 모르겠습니다.

feature map을 기반으로 어떤 벡터를 추출하는거죠??

 

---

4.

FC Layer 가 Fully connected layer가 이미지를 예측한다는걸 알겠는데

FC Layer는 feature map을 1D로 만든 값을 기준으로 어떤 object인지 예측하는게 아닌가요?

그 후 다시 SVM Classifier를 하는게 이해가 잘 안갑니다!

 

---

5.

Flatten 된 값들을 가지고 좌표를 예측한다고 하셨는데, 어떻게 1차원 값을 가지고 좌표를 예측하는지 이해가 잘 안갑니다...

 

---

질문을 한번에 너무 많이 남겨서 죄송합니다..

혹시 다음에 질문을 개별로 남겨야된다면 알려주시면 감사하겠습니다!

 

좋은 강의 제공해주셔서 감사합니다!

딥러닝 python keras tensorflow 머신러닝 배워볼래요? 컴퓨터-비전

답변 1

1

권 철민

안녕하십니까, 

1.

과정이

a. region proposal로 RoI 2000개 추출

b. 2000개의 각 이미지들은 따로 feature extractor에 입력

c. feature extractor에서 feature map 추출

d. feature map -> 1D로 추출

e. FC Layer 에서 확률 추출

맞나요??

=> 네 맞습니다. 

2. 

1-c. 과정에서 feature map이 뭔지 잘 모르겠습니다

각 이미지에서 feature extractor를 추출한다는게 

사람으로 예를 들자면 눈과 같은 특징들을 추출한게 feature map이라고 보면 될까요??

=> 네, 맞습니다. 

 

3.

1-d. e. 과정에서 1D -> FC Layer에 입력이 무엇을 하는지 잘 모르겠습니다.

feature map을 기반으로 어떤 벡터를 추출하는거죠??

=> 이게 딥러닝의 일반적인 이미지 classfication 방식입니다.  어떤 벡터를 추출하는지는 정확히 모르지만 FC layer를 연속으로 붙여서 과적합(overfitting)과 최종 classification 단에서 성능을 약간 높이는데 일반화된 방식입니다. 

4.

FC Layer 가 Fully connected layer가 이미지를 예측한다는걸 알겠는데

FC Layer는 feature map을 1D로 만든 값을 기준으로 어떤 object인지 예측하는게 아닌가요?

그 후 다시 SVM Classifier를 하는게 이해가 잘 안갑니다!

=> 정확히 애기하자면 Fully connected layer에서 예측을 하지는 않습니다. 물론 최종 fully connected layer에서 일반적으로 예측합니다. 그리고 RCNN에서 이렇게 모델을 만들어도 되었는데, 최종 Layer를 fully connected 로 안하고 SVM으로 했을 때 더 성능이 좋았다고 합니다. 

앞에 Fully connected layer는 3번 답변 드린대로 최종 layer이전에 한두개의 dense layer를 붙여서 성능을 조금 향상시킬 수 있는 일반적인 기법입니다.  

5.

Flatten 된 값들을 가지고 좌표를 예측한다고 하셨는데, 어떻게 1차원 값을 가지고 좌표를 예측하는지 이해가 잘 안갑니다..

=> 음, 이것 역시 딥러닝 회귀의 일반적인 방식입니다. feature map기반에서 좌표값을 가지고 dense layer를 학습하면서 좌표를 예측하는 방식입니다. 이건 딥러닝 회귀 모델을 좀 인터넷에서 찾아보시면 좀 더 이해가 쉬울 것 같습니다. 

감사합니다. 

0

HAHA

제가 지식이 부족해서 질문이 애매했을텐데, 자세히 답변해주셔서 감사합니다!

MMDetection 버전 이슈

0

59

2

강의 환경설정 질문

0

66

2

Custom Dataset에서의 polygon 정보 관련

0

114

3

cvat.ai 보안 수준이 궁금합니다

0

101

2

캐클 nucleus 챌린지 runpod 실습 코드 에러 질문드립니다.

0

120

3

추론 결과의 Precision(또는 mAP) 평가 방법

0

98

2

mmdetection mask rcnn inferenct 실습 시 runpod 템플릿 관해서 질문드립니다.

0

71

2

runpod에서 google drive 연결 시 오류 발생

0

128

2

로드맵 선택

0

74

1

mmcv

0

66

2

Anchor box의 Positive 처리 위치

0

71

2

해당 강의 runpod 적용 후 에러 제보드립니다

0

97

2

run pod credit 관련 제보

0

129

2

mmdetection 2.x과 3.x 호환 관련 표기

0

89

2

mm_faster_rcnn_train_kitti.ipynb 실행 오류

0

115

3

질문 드립니다.

0

89

3

mm_faster_rcnn_train_coco_bccd 실행 오류 질문드립니다.

0

90

1

강사님께 수정을 제안드리고 싶은 것이 있습니다.

0

103

1

google automl efficientdet 다운로드 및 설치 오류

0

87

1

이상 탐지에 사용할 비전 기술 조언 부탁드립니다.

0

113

2

OpenCV 관련 질문드립니다.

0

88

2

mmcv 설치관련해서 문의드려요

0

361

3

강의 구성 관련해서 질문이 있습니다

1

141

2

모델 변환 성능 질문드립니다.

0

129

1