묻고 답해요
140만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
Segmentation 시각화에 문제가 생겨 질문 드립니다.
mmdetection과 오픈소스 데이터셋으로 실습을 하려는 학생입니다. coco format의 데이터를 받아 시각화를 하려하는데, 시각화 과정에서 이미지의 아이디에 대응하는 세그먼트가 나오는 것이 아니라 사전에 설정된 세그먼트가 아래 그림처럼 이미지와 상관없이 나와 이 문제를 해결하고 싶습니다. 이 세그먼트가 어디에 영향을 받는지 찾아보니 mask rcnn 벌룬 실습코드 기준 3개 셀 위인 이 셀의 coco.loadimgs(*)[0] 중 *에 영향을 받는 것으로 추측할 수 있었습니다. (해당 id를 바꾸면 고정된 세그먼트가 다른 걸로 바뀝니다.) 어디서 문제가 생긴지는 알겠으나 코드를 수정하기엔 모르는 것이 많아 이 문제를 어떻게 해결할 지 여쭤보고자 질문 남깁니다. 추가로 1. 시각화 과정에는 문제가 있어도 학습에는 문제가 없을지(시각화 코드를 수정하지 않아도 학습 코드를 돌리면 제대로 학습이 되는지?) 2. Json 파일에 등록된 이미지의 일부만 images 폴더에 있어도 학습이 되는지(데이터셋이 28만장 이미지로 이루어져있어서 colab이 pro 버전임에도 i/o error를 출력함. 그래서 이미지 중 일부 -약 1만장- 만 빼서 학습에 사용한다면?)? 에 대해서도 답변 남겨주시면 감사하겠습니다. 늘 좋은 강의 잘 듣고 있습니다. 감사합니다.
-
해결됨딥러닝 CNN 완벽 가이드 - Fundamental 편
target_size 인수에 대한 질문
안녕하세요? 항상 좋은 강의 감사드립니다. CNN 을 여러가지 소스로 공부하고 있었지만 중간중간 막히는 부분이 많았었는데, 본 강의를 들으며 하나씩 뚫리는 기분이 듭니다. ImageDataGenerator 인스턴스의 flow_from_directory 메소드 에서 사용되는 target_size 인수에 대한 질문입니다. 본 기능을 통해 variety 한 이미지 손쉽게 사이즈들을 단일 사이즈로 통일시켜서 모델에 input 시킬 수 있을 듯 한데요, 예를 들어 input 이미지가 256 X 1024 등과 같이 세로로 wide 하게 찍은 사진인 경우도 224 X224 로 짜부해서 강제로 맞추는 방법인 것으로 이해하면 되는지.. 문의드립니다. 만약 그렇다면 그 방법 자체가 agumentation 이 적용된 것과 같은 효과가 되는 것은 아닌지요..? 이미지가 왜곡되어 학습을 어렵게 한다는 측면에서는 over fit 에 유리한 부분도 있겠지만 사진의 특징을 잡아내는데 어려움을 주게 되고, 모델 성능에 한계를 주는 요인이 될 수 있지 않을까 싶어서요 아직은 잘은 모르고... 개념적으로만 들은 keyword 이지만, segmentation 과 같은 방법으로 전체 이미지 중에서도 관심을 가지는 특정 부분을 잡아낸 이후에 target_size=(224, 224) 와 같이 설정하는 방법이 예측성능 측면에서는 더 좋을 것 같기는 한데요... 제가 이해한 것이 맞을지 문의드립니다.
-
미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
segmentation mask를 생성하는 툴은 어떤 것을 가장 많이 사용하나요?
안녕하세요 segmentation mask를 생성하는 툴 중 가장 많이 사용하고, UI가 좋은게 무엇이 있나요? 여러 개체를 instance 할 것은 아니고 흑백 mask를 생성하려고 하는 용도입니다
-
미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
프로젝트를 위한 커스텀 데이터셋 구현에 대해 질문이 있습니다!
안녕하세요 선생님! 학부생으로써 딥러닝 영상처리 프로젝트를 수행하며, 강의를 통해 정말 집약되고 많은 도움을 얻을 수 있었습니다. 한가지 궁금한 것이 있는데, MatterPort Mask R-CNN 모델에 학습데이터를 Load할 때 kaggle 데이터셋과 같이 이미지와 라벨이미지, 그리고 annotation이 csv파일로 되어있는 것처럼 특정한 데이터의 형식이 있어야 하는것으로 알고 있습니다. 혹시 개인이 커스텀데이터셋을 구현할 때 이용할 수 있는, 즉 본인의 커스텀데이터를 kaggle 데이터셋과 같은 형식이 있는 데이터셋으로 저장할 수 있는 방법이나, 프로그램툴이 어떤 것이 있을지 궁금합니다!