인프런 영문 브랜드 로고
인프런 영문 브랜드 로고

인프런 커뮤니티 질문&답변

stoh님의 프로필 이미지
stoh

작성한 질문수

[개정판] 딥러닝 컴퓨터 비전 완벽 가이드

Keras-retinanet 트레이닝시 궁금한 점이 있습니다.

작성

·

165

1

우선 좋은 강의들으면서 많은 참고가되게 해주셔서 감사합니다.

이번에 프로젝트를 진행하는데 keras-retinanet을 사용하여 object detect 를 하고 있습니다.

검출 물체는 이미지의 Crack이나 Defect인데 잘 검출되고 있습니다. 

다만 이미지 트레이닝시 1개의 이미지에 2개 이상의 Defect나 Crack이 있을때 거기에 맞는 csv 파일을 생성 하여

트레이닝할 경우 손실률과 정확도가 떨어지는 증상이 있습니다.  1개의 이미지에 1개의 object들을 각각

트레이닝하여 최종 검증은 1개의 이미지에 여러개의 object들을 검출하는 것은 매우 잘 됩니다.

그러나 트레이닝시 1개의 이미지에 여러개의 object가 있는 시료를 사용할 경우에만 정확도가 좀 떨어지네요..

참고로 csv 파일은 포맷대로 동일한 이미지에 클래스, 좌표정보 정확하게 넣어줬습니다.

이게 keras-retinanet이 csv파일을 만들때 이미지 중심이 아닌 object 중심이라 그런것인지

제 추측은 이미지에서 사용자가 만들어준 좌표정보를 참고하여 트레이닝하면서 다른 부분의 비슷한 object 들로 인하여

regression loss가 떨어지는것이 원인으로 보이는데...

트레이닝시에는 무조건 1개의 이미지에서 1개의 object만 트레이닝을 해야 하게끔 설계가 되어 있는 것인가요?

다른 방법이 따로 있는 것인지 궁금합니다.

정리

- 1개의 이미지에 1개의 object만 나온 이미지를  각각 트레이닝 시 정확도및 손실률 모두 좋음 .

   이 모델로 1개의 이미지에 여러개의 object 잘 잡힘.

- 1개의 이미지에 2개 이상의 object가 있는 이미지를 각각 트레이닝 시 정확도및 손실률 좋지 않음.

   이 모델로 1개의 이미지에 여러개의 object 잘 잡히지 않음.(잡힌 object도 score률이 50% 언저리)

답변 1

0

권 철민님의 프로필 이미지
권 철민
지식공유자

안녕하십니까,

1개의 이미지에 1개의 object가 있는 이미지는 일반적으로 1개의 오브젝트만 있는 경우만 Detect하는 경우라면  적은 이미지 갯수로도 Detect가 잘됩니다.  그리고 여러개의 object Detect는 상대적으로 성능이 떨어집니다.

그런데 이 모델로 1개의 이미지에 여러개의 object가 잘 되는데 반면에 1개의 이미지에 2개 이상의 object가 있는 이미지를 학습시 여러개의 object가 잘 안되는 부분이 신기하군요.  (보통 분류에서 Logistic Regression이 binary classification을 여러개 결합해서 multi classification하는데 이미지에서도 통하다니 저도 테스트를 해보고 싶군요)

먼저 점검해 봐야 할 부분은 아래와 같습니다.  확인해 보시고, 내용 업데이트 부탁드립니다.

1. 1개 이미지의 2개 이상의 object가 있는 이미지 파일의 갯수. object 대비 충분한 image가 있는지 확인 필요.

2. 1개 이미지의 2개 이상의 object가 있는 이미지 파일의 선명도. 특히 해당 object가 얼마나 선명하지의 여부.

감사합니다.

stoh님의 프로필 이미지
stoh

작성한 질문수

질문하기