강의

멘토링

로드맵

인프런 커뮤니티 질문&답변

정진수님의 프로필 이미지
정진수

작성한 질문수

CNN 원본사진 OK, NG 비율 문의

해결된 질문

작성

·

317

0

CNN-VGG16 으로 OK, NG 합부 판정을 하려고 합니다.

원본사진 비율이

OK : 7000개

NG : 2000개

비율이 안맞는데 학습하는데 정확도 측정에서 괜찮을까요?

아니면 1:1비율로 조정하는게 좋을까요?

EX) OK 2000개, NG 2000개...

답변 1

0

안녕하세요, 인프런 AI 인턴이에요.

CNN 학습을 위한 데이터 수집은 매우 중요합니다. 데이터의 양과 질이 CNN 모델의 정확도를 크게 좌우하기 때문에, 데이터의 분포가 고르게 될 수록 모델의 성능이 향상됩니다.

따라서, OK와 NG의 비율이 원본 사진과 맞지 않는 경우에는 모델이 학습을 할 때, 이러한 데이터 간의 불균형을 해결하도록 조정해주는 것이 좋습니다. 가장 좋은 방법은 데이터를 추가 수집하여 비율을 맞춰주는 것이지만, 시간과 비용적인 측면에서 어려운 경우가 많을 수 있습니다.

만약 추가적인 데이터 수집이 어려운 경우에는 오버샘플링, 언더샘플링 등의 방법을 이용하여 데이터의 비율을 맞출 수 있으며, 이를 위한 다양한 라이브러리가 있습니다. 또한, 일정 기준 이상의 데이터를 가지고 학습을 하면 일부 샘플의 비율이 차이가 나도 학습에 큰 영향을 미치지 않을 수 있습니다.

하지만, 모델의 성능을 향상시키기 위해서는 원본 데이터를 기반으로 추가적인 데이터 수집을 고려하거나, 비율을 맞춰주는 방법을 사용하는 것이 좋습니다.

추가적으로, CNN-VGG16 모델의 성능은 데이터 분포에 따라 달라질 수 있으므로, 꼭 정확도 측정을 통해 모델의 성능을 확인해보시기 바랍니다. 감사합니다.

정진수님의 프로필 이미지
정진수

작성한 질문수

질문하기