inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[개정판] 딥러닝 컴퓨터 비전 완벽 가이드

안녕하세요 COCO 데이터셋 annotation 구성에 대해서 궁금한 점이 있습니다

247

젓인

작성한 질문수 158

0

안녕하세요. coco 데이터셋에서 annotation에 있는 순서대로 미니배치가 정해지는 것인가요?

예를 들어 annotation에서 클래스마다 섞여 있는 것이 아니라 1 100개, 2 100개, 3 100개 등으로 순서대로 구성되어 있으면 이것이 순서대로 들어간다면, train에 문제가 생길 수 있는 여지를 주는 것 같아서요

제가 잘못 생각하고 있는 것인가요? 

감사합니다

머신러닝 배워볼래요? 컴퓨터-비전 tensorflow 딥러닝 keras python

답변 5

1

권 철민

1 이 아마 '사람(person)' 이라 많을 겁니다.

앞서 말씀 드린 대로 큰 이슈 없습니다.  또 train시에 shuffle로 섞을 수 있습니다.

0

젓인

감사합니다

0

젓인

네 json 파일이 아래와 같이 구성됐을 때입니다

train.json · GitHub

category_id가 1,2,3 이렇게 순서대로 반복된 형태입니다. 지금 데이터셋 자체가 1이 굉장히 많고, 숫자가 커질수록 데이터셋 갯수가 줄어들게 됩니다

0

젓인

네 json 파일이 아래와 같이 구성됐을 때입니다

train.json · GitHub

0

권 철민

안녕하십니까,

질문을 제가 제대로 이해했는지 의문입니다만,

예를 들어 annotation에서 클래스마다 섞여 있는 것이 아니라 1 100개, 2 100개, 3 100개 등으로 순서대로 구성되어 있으면 이것이 순서대로 들어간다면, train에 문제가 생길 수 있는 여지를 주는 것 같아서요

=> annotation에서 클래스마다 섞여 있지 않나요?

설혹 섞여있지 않아도 성능이 크게 떨어지지는 않지만, train시에 학습 데이터를 섞는 방법이 있습니다. 

가령 keras같은 경우 fit()/fit_generator()에 shuffle 인자가 있습니다. 이를 이용하면 iteration 시마다 학습 데이터를 섞어버리기에 별 문제가 되지 않습니다.

강의 환경설정 질문

0

38

2

Custom Dataset에서의 polygon 정보 관련

0

81

3

cvat.ai 보안 수준이 궁금합니다

0

77

2

캐클 nucleus 챌린지 runpod 실습 코드 에러 질문드립니다.

0

93

3

추론 결과의 Precision(또는 mAP) 평가 방법

0

81

2

mmdetection mask rcnn inferenct 실습 시 runpod 템플릿 관해서 질문드립니다.

0

57

2

runpod에서 google drive 연결 시 오류 발생

0

106

2

로드맵 선택

0

64

1

mmcv

0

55

2

Anchor box의 Positive 처리 위치

0

59

2

해당 강의 runpod 적용 후 에러 제보드립니다

0

83

2

run pod credit 관련 제보

0

93

2

mmdetection 2.x과 3.x 호환 관련 표기

0

75

2

mm_faster_rcnn_train_kitti.ipynb 실행 오류

0

93

3

질문 드립니다.

0

74

3

mm_faster_rcnn_train_coco_bccd 실행 오류 질문드립니다.

0

75

1

강사님께 수정을 제안드리고 싶은 것이 있습니다.

0

91

1

google automl efficientdet 다운로드 및 설치 오류

0

71

1

이상 탐지에 사용할 비전 기술 조언 부탁드립니다.

0

100

2

OpenCV 관련 질문드립니다.

0

68

2

mmcv 설치관련해서 문의드려요

0

325

3

강의 구성 관련해서 질문이 있습니다

1

133

2

모델 변환 성능 질문드립니다.

0

121

1

NMS 로직 문의 드려요

0

110

2