현업에서 CNN은 어떻게 구현하나요?

Question

좋은 강의 감사드립니다..수강 중 의문점이 있어 문의드려요.강의 중 [AI HW Lab2] CNN Verilog HDL Practice 1 (Simulation) - 문제설명편 ppt 의 약 9:14초 정도에서 '현업에서는 이러한 CNN_CORE를 사용하지 않아요' 라고 말씀하셨는데 그 뜻이 궁금합니다.veriolg가 아닌 HLS 등을 사용해서 구현한다는 건지 ? 아님 다른 가속용 IP core를 사와서 구현한다는 뜻인지? 아닌 다른 뜻이 있는지 알고 싶습니다.그 외에 현업에서 실제로 어떠한 방식으로 딥러닝 IP를 구현하는지 간단하게 설명 부탁드려도 될까요?

Answer

안녕하세요 :)'현업에서는 이러한 CNN_CORE를 사용하지 않아요' 라고 말씀하셨는데 그 뜻이 궁금합니다.헷갈릴 여지가 있겠네요.실제 NPU 를 설계하는 업체들은, 이렇게 '고정된 연산' 을 하는 Core 를 사용하지 않습니다.현재 저희가 설계한 Core 는 Convolution 만 가능하죠.좀 더 General 한 Core 를 설계해야, Convolution 뿐만아니라 Fully Connected 라던가 혹은 다른 연산들, PW, DW 등등 을 지원할 수 있어요. General 하게 지원하려면 행렬 연산 최적화가 더 중요할 것 같습니다.그런 의미로, 이러한 CNN_CORE 를 사용하지 않는다 이해해주시면 될 것 같아요.하지만 우리는 CNN_CORE 만 잘하면 된다, 라는 전제라면 사용할 수 있을 것 같아요.FPGA 같은 경우에는 언제든지 설계 변경이 Programable 하기 때문에, 이런 '고정된 연산' 을 사용하기에 적합할 것 같습니다.즐공하세요 :)

muonk

현업에서 CNN은 어떻게 구현하나요?

이 글과 비슷한 Q&A

SIMULATION 시간 관련 질문 드립니다.

valid/ready handshake에서 질문있습니다

[Board 49-71] 보드가 잡히지않는다고 에러가 뜹니다.

현업에서의 HLS