inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[개정판] 딥러닝 컴퓨터 비전 완벽 가이드

train 데이터셋 관련

163

fish2631

작성한 질문수 27

0

안녕하세요 선생님, 학습하다보니 궁금증이 많이 생기네요^^

데이터셋을 학습할 때 효율성에 대해 여쭙고 싶은데요,

첫 번째 그림은 한 이미지파일안에 한개의 WBC가 있고, 두 번째 그림은 한 이미지파일안에 두 개의 WBC가 있는데요,

WBC를 질 학습하기 위해서 첫 번째 그림 2개와 두 번째 그림 1개와 똑같은 성능을 기대해볼 수 있을까요?

만약 똑같은 성능을 기대해볼 수 있다면, 한 이미지파일에 WBC가 많을 수록 학습 효율이 좋다는 것일까요?

keras python 컴퓨터-비전 tensorflow 머신러닝 배워볼래요? 딥러닝

답변 1

2

권 철민

안녕하십니까,

음, 무척 흥미로운 질문이군요.

먼저, 정량적으로 딱 이게 더 좋은 경우입니다라고 말씀 드리기는 어려울 것 같습니다만,

object 갯수가 적은 이미지 보다는 더 많은 object 갯수를 가진 이미지가 더 학습 효율이 좋을 수 있습니다.

일반적으로 현실 상황과 비슷한 이미지의 object 구성이 제일 좋습니다. 그러니까, 보통 이미지를 테스트할 때 한개 object보다는 두개 이상의 object들이 확연히 더 많은 경우라면 두개 이상의 object들이 있는 경우가 더 좋습니다.

그럼에도 불구하고 어떤 이미지 한개가 다른 이미지 두개와 맞먹는 효과를 나타낸다라고 말씀 드리기는 어려울 것 같습니다. 일반적으로 그런식으로 적용하기 보다는 한개의 object가 있는 이미지, 두개의 object가 있는 이미지, 또는 두개 이상의 object가 있는 이미지를 다양하게 만들어서 학습 데이터로 구성하는 게 더 좋다고 생각합니다.

학습 데이터가 많다고 모델이 학습이 잘 되는 게 아닙니다. 학습데이터는 작아도 다양한 유형으로 학습 데이터를 구성하는 것이 더 좋은 결과로 이어질 수 있습니다.

감사합니다.

MMDetection 버전 이슈

0

52

2

강의 환경설정 질문

0

61

2

Custom Dataset에서의 polygon 정보 관련

0

113

3

cvat.ai 보안 수준이 궁금합니다

0

98

2

캐클 nucleus 챌린지 runpod 실습 코드 에러 질문드립니다.

0

120

3

추론 결과의 Precision(또는 mAP) 평가 방법

0

94

2

mmdetection mask rcnn inferenct 실습 시 runpod 템플릿 관해서 질문드립니다.

0

68

2

runpod에서 google drive 연결 시 오류 발생

0

126

2

로드맵 선택

0

74

1

mmcv

0

65

2

Anchor box의 Positive 처리 위치

0

71

2

해당 강의 runpod 적용 후 에러 제보드립니다

0

95

2

run pod credit 관련 제보

0

125

2

mmdetection 2.x과 3.x 호환 관련 표기

0

89

2

mm_faster_rcnn_train_kitti.ipynb 실행 오류

0

114

3

질문 드립니다.

0

89

3

mm_faster_rcnn_train_coco_bccd 실행 오류 질문드립니다.

0

89

1

강사님께 수정을 제안드리고 싶은 것이 있습니다.

0

102

1

google automl efficientdet 다운로드 및 설치 오류

0

87

1

이상 탐지에 사용할 비전 기술 조언 부탁드립니다.

0

111

2

OpenCV 관련 질문드립니다.

0

87

2

mmcv 설치관련해서 문의드려요

0

357

3

강의 구성 관련해서 질문이 있습니다

1

141

2

모델 변환 성능 질문드립니다.

0

126

1