• 카테고리

    질문 & 답변
  • 세부 분야

    반도체

  • 해결 여부

    미해결

현업에서 CNN은 어떻게 구현하나요?

22.10.13 16:59 작성 조회수 540

1

좋은 강의 감사드립니다..

수강 중 의문점이 있어 문의드려요.

강의 중 [AI HW Lab2] CNN Verilog HDL Practice 1 (Simulation) - 문제설명편 ppt 의 약 9:14초 정도에서 "현업에서는 이러한 CNN_CORE를 사용하지 않아요" 라고 말씀하셨는데 그 뜻이 궁금합니다.

veriolg가 아닌 HLS 등을 사용해서 구현한다는 건지 ? 아님 다른 가속용 IP core를 사와서 구현한다는 뜻인지? 아닌 다른 뜻이 있는지 알고 싶습니다.

그 외에 현업에서 실제로 어떠한 방식으로 딥러닝 IP를 구현하는지 간단하게 설명 부탁드려도 될까요?

 

답변 1

답변을 작성해보세요.

0

안녕하세요 :)

"현업에서는 이러한 CNN_CORE를 사용하지 않아요" 라고 말씀하셨는데 그 뜻이 궁금합니다.

헷갈릴 여지가 있겠네요.

실제 NPU 를 설계하는 업체들은, 이렇게 "고정된 연산" 을 하는 Core 를 사용하지 않습니다.

현재 저희가 설계한 Core 는 Convolution 만 가능하죠.

좀 더 General 한 Core 를 설계해야, Convolution 뿐만아니라 Fully Connected 라던가 혹은 다른 연산들, PW, DW 등등 을 지원할 수 있어요. General 하게 지원하려면 행렬 연산 최적화가 더 중요할 것 같습니다.

그런 의미로, 이러한 CNN_CORE 를 사용하지 않는다 이해해주시면 될 것 같아요.

하지만 우리는 CNN_CORE 만 잘하면 된다, 라는 전제라면 사용할 수 있을 것 같아요.

FPGA 같은 경우에는 언제든지 설계 변경이 Programable 하기 때문에, 이런 "고정된 연산" 을 사용하기에 적합할 것 같습니다.

즐공하세요 :)