inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[개정판] 딥러닝 컴퓨터 비전 완벽 가이드

YOLO v1 의 이해 - 01

v1 vs v2 질문있습니다.

143

하키빌리지

작성한 질문수 10

0

안녕하세요 :)

offset 값+ 클래스 스코어 등의 정보를 셀 별로 갖는 것과 BB별로 갖는 것의 차이가 무엇인지 궁금합니다. 

v1의 셀 당 두개의 BB를 갖던 것을  셀 당 다섯개의 BB를 갖도록 변경해서 모든 정보를 한 셀이 갖는 것이 아니라

v2처럼 5개의 BB가 개별로 정보를 갖는 것으로 변경되면서 얻을 수 있는 이점이 무엇인지 궁금합니다.

v1에서 두 개의 BB가 하나의 Class Scores를 공유했다면

v2에서는 5개의 BB별로 각자의 Class Scores가 존재해서 정확성을 높일 수 있는 것인지 추측해봤습니다.

만약 맞다면 v1에서 공유했던 class socres는 두 BB의 무엇을 기준으로 추출된 것인지 궁금합니다.

이해력이 부족하여 질문이 잦아 죄송스럽습니다 ㅠ

미리 감사의 말씀 올립니다!

컴퓨터-비전 머신러닝 배워볼래요? tensorflow python 딥러닝 keras

답변 1

1

권 철민

안녕하십니까,

v1의 제일 큰 문제는 cell 레벨의 Detection으로 cell에 있는 여러개의 작은 클래스들을 Detection 할 수 없었다는 것입니다. 여러명이 한 cell에 있는 경우 이들을 모두 Detection 할수가 없었습니다.

그래서 anchor box 기반으로 바꾼것입니다. 이들 개별 anchor들은 또한 shape, ratio 들이 달라서 다양한 형태의 클래스들 특히 V1과 다르게 여러개의 클래스들이 모여 있는 경우들도 Detection 할 수 있었습니다.

V2에서는 말씀하신대로 anchor 별로 클래스 확률을 가집니다. v1은 bbox가 클래스 확률을 가진다기 보다는 bbox 위치 정보를 가지는 것이고 cell 이 클래스 확률을 가집니다. v1은 cell 이 중심입니다.

감사합니다.

강의 환경설정 질문

0

38

2

Custom Dataset에서의 polygon 정보 관련

0

82

3

cvat.ai 보안 수준이 궁금합니다

0

78

2

캐클 nucleus 챌린지 runpod 실습 코드 에러 질문드립니다.

0

94

3

추론 결과의 Precision(또는 mAP) 평가 방법

0

82

2

mmdetection mask rcnn inferenct 실습 시 runpod 템플릿 관해서 질문드립니다.

0

58

2

runpod에서 google drive 연결 시 오류 발생

0

106

2

로드맵 선택

0

65

1

mmcv

0

56

2

Anchor box의 Positive 처리 위치

0

60

2

해당 강의 runpod 적용 후 에러 제보드립니다

0

84

2

run pod credit 관련 제보

0

95

2

mmdetection 2.x과 3.x 호환 관련 표기

0

76

2

mm_faster_rcnn_train_kitti.ipynb 실행 오류

0

94

3

질문 드립니다.

0

75

3

mm_faster_rcnn_train_coco_bccd 실행 오류 질문드립니다.

0

76

1

강사님께 수정을 제안드리고 싶은 것이 있습니다.

0

92

1

google automl efficientdet 다운로드 및 설치 오류

0

72

1

이상 탐지에 사용할 비전 기술 조언 부탁드립니다.

0

101

2

OpenCV 관련 질문드립니다.

0

70

2

mmcv 설치관련해서 문의드려요

0

327

3

강의 구성 관련해서 질문이 있습니다

1

134

2

모델 변환 성능 질문드립니다.

0

122

1

NMS 로직 문의 드려요

0

112

2