• 카테고리

    질문 & 답변
  • 세부 분야

    컴퓨터 비전

  • 해결 여부

    미해결

논문 구현 조언 부탁드립니다.

23.07.26 12:15 작성 조회수 437

0

안녕하십니까 강의를 듣다 조언을 좀 부탁드릴 수 있을까 싶어 연락드립니다.

현재 2학년 재학중으로 컴퓨터비전 분야의 대학원을 생각하고 있습니다.

대학원을 준비하면서 여러 공부를 해본 결과 논문을 구현해보기로 결심했습니다.

그래서 강의 초반에 설명하시는 faster rcnn을 구현하고자 했지만 실패하고 말았습니다.

혹시 구현하기에 난이도가 좀 더 낮은 모델을 추천해주실 수 있는지 글 남깁니다.

이상입니다.

답변 1

답변을 작성해보세요.

1

안녕하십니까,

오, 아직 2학년인데 대단하시군요.

Faster RCNN은 구현이 꽤 어렵습니다. 오히려 SSD나 Yolo 가 상대적으로 더 쉬울 수 있습니다. 제 생각엔 SSD가 Yolo보다 살짝 구현이 더 쉬울 수는 있는데, Yolo가 Object Detection에서 상당히 영향력이 크기 때문에 Yolo 구현을 해보시면 좋을 것 같습니다.

Yolo v1, v3 정도 직접 구현해 보시면 Object Detection 모델 이해 능력이 급 상승(?) 하실 것입니다.

다만 Object Detection 모델 구현이 쉬운 것은 아닙니다. 특히 Yolo는 anchor mapping 및 loss 함수 구현등이 좀 어렵습니다. 아마 처음 도전하시면 중간에 포기하실 확률이 매우 높습니다. 하지만 처음에 실패하더라도 조금 쉬었다가, 다시 재 도전하는 것을 반복해 보시면 어느덧 Yolo 구현 목표에 도달하실 수 있으실 것입니다.

감사합니다.

언시님의 프로필

언시

2023.08.03

image안녕하세요! 드디어 yolo v1 구현에 성공한 것 같습니다. 이제 nms 만 적용해서 결과물만 파싱하면 될 것 같습니다! 하루에 12시간씩 일주일 걸린 것 같습니다 ㅎㅎ 논문 구현하면서 정말 너무 재밌었습니다. cnn 강의에서 배운 커스텀 Dataset 및 이번 강좌에서 다루어주신 vocdataset xml 파싱하는 부분이 데이터 전처리를 진행하는데 정말 큰 도움이 됐습니다.

답변에서 말씀해주신 loss 부분 구현이 정말 너무 어려웠습니다. iou 구해서 responsible bbox를 찾는 부분은 너무 수월했지만... obj, none obj를 구해서 따로 로스를 매기는 부분이 정말 너무 어려웠습니다. 그리고 배치처리를 하고 싶어 원본 이미지를 전부 224,224로 바꾸고 bbox 좌표를 각 셀에 해당하는 0~1로 변경하는 과정을 진행하면서 정말 알고리즘 구현 능력도 중요하다는 것을 느꼈습니다.

비록 이번 구현에서는 model.fit을 사용해서 학습 부분을 구현했지만, 남은 방학 기간동안 커스텀 train step 까지 구현해서 yolo v1 v3에 적용해볼 계획입니다.

좋은 강의 정말 감사합니다!

와우, 대단하군요.

Yolo가 구현이 쉽지 않은데, 1주일만에 이걸 완성하다니...(저 대학생때랑은 레벨이 완전 다르군요. 부럽습니다 ^^;;)

이대로만 정진하신다면, 졸업하실때 쯤에는 어느곳에서든 기대되는 인재로 성장하실 것 같군요.