소개
게시글
질문&답변
BB regression 관련(wrt Retinanet)
답변감사드립니다!
- 0
- 2
- 149
질문&답변
GCP 인스턴스 할당 관련 메세지
답변 정말 감사드립니다 오늘도 아쉽게도 안되네요.. 코랩으로도 충분히 학습이 되므로 코랩으로 진행하겠습니다. 덕분에 GCP도 만져봐서 좋은 경험이었다고 생각합니다. 자격증도 있던데 관심이 많이 가네요:) 감사합니다!
- 0
- 2
- 176
질문&답변
mask rcnn 학습에 관해서
답변 감사합니다! 좀 후련해진거 같습니다. 퇴근하고 너무 재밌어서 정주행했는데 어디새 거의 완강이네요 좋은 강의 너무 감사드리고 처음부터 복습하면서 질문 또 드리겠습니다:)
- 1
- 5
- 347
질문&답변
mask rcnn 학습에 관해서
친절한 답변 늘 진심으로 감사드립니다. Fully conv 레이어를 의식안하고 이해를 해서 이해도가 심하게 떨어졌네요.. 정정해주셔서 감사합니다. Fully conv 레이어에서 나온 맵을 upsampling을 해서 원본이미지에 맞추고 이를 마스크한 정답 라벨과 손실계산해서 학습하는 것이 군요. 추가로 이해가 확실하지 않은 부분을 질문 드리고 싶습니다. 1. RPN관련 새로운 알고리즘을 공부할때 먼저 입력과 정답 라벨이 뭔지 파악하려고 합니다. 그러면 내부가 블랙박스여도 대충 이해가 빨리 되는 느낌이 들어서인데요, 하기에 제가 이해한 내용을 작성해봤는데요, 확인 부탁드립니다. 좌표의 경우, 정답라벨이 앵커박스 자체의 x,y,h,w이고(ground truth 좌표가 아니라) 학습하는 내용은 RPN이 예측한 x,y,h,w와 앵커박스 자체의 x,y,h,w의 차이를 줄이는 방향으로 진행한다. 결국 학습하고 나면 RPN의 출력값은 ground truth박스와 iou가 0.7이상 되는 앵커박스의 좌표값에 근접한 값이 나오기를 기대한다. 정확한 ground truth박스 좌표와의 offset을 줄이거나 클래스 자체에 대한 세밀한 학습은 후반부에 맡긴다. 2. Faster RCNN 후반부 관련 RPN에서 나온 좌표값을 RPN에 들어가기 전 feature map에 대입하여 그 영역의 feature map을 추출하고 이를 사이즈 조정을 위해 풀링하고 FC에 넣어 학습하는데 이때 정답라벨은 실제 원본이미지의 ground truth의 좌표와 클래스 id이다. 3. mask RCNN의 mask예측 부분 관련 RPN에서 나온 좌표값을 이용하여 feature map을 추출하고 ROI align과 upsampling을 겨처 원본이미지 사이즈로 복원하고 이때 정답 라벨은 원본이미지에서 해당 클래스만 1로 activate된 mask이다. 확인 부탁드리겠습니다. 감사드립니다.
- 1
- 5
- 347
질문&답변
3x3 conv 및 1x1 conv
답변 정말 감사드립니다. 3x3 conv이 Feature map의 주변 픽셀들의 각 512채널들을 이용하여 연산되므로 같은 사이즈의 주변 픽셀값을 반영한 새로운 Feature map을 만들어지고(padding = same이므로) 이걸 다시 1x1conv 시켜 학습하고자 하는 채널수에 맞게 feature들을 뽑아내어(분류는 2x9개, 회귀는 4x9개) 학습이 되게 되는 원리이군요 많은 공부가 되었습니다. 감사합니다!
- 0
- 2
- 215