-
카테고리
-
세부 분야
반도체
-
해결 여부
미해결
현업에서 CNN은 어떻게 구현하나요?
22.10.13 16:59 작성 조회수 540
1
좋은 강의 감사드립니다..
수강 중 의문점이 있어 문의드려요.
강의 중 [AI HW Lab2] CNN Verilog HDL Practice 1 (Simulation) - 문제설명편 ppt 의 약 9:14초 정도에서 "현업에서는 이러한 CNN_CORE를 사용하지 않아요" 라고 말씀하셨는데 그 뜻이 궁금합니다.
veriolg가 아닌 HLS 등을 사용해서 구현한다는 건지 ? 아님 다른 가속용 IP core를 사와서 구현한다는 뜻인지? 아닌 다른 뜻이 있는지 알고 싶습니다.
그 외에 현업에서 실제로 어떠한 방식으로 딥러닝 IP를 구현하는지 간단하게 설명 부탁드려도 될까요?
답변을 작성해보세요.
0
설계독학맛비
지식공유자2022.10.14
안녕하세요 :)
"현업에서는 이러한 CNN_CORE를 사용하지 않아요" 라고 말씀하셨는데 그 뜻이 궁금합니다.
헷갈릴 여지가 있겠네요.
실제 NPU 를 설계하는 업체들은, 이렇게 "고정된 연산" 을 하는 Core 를 사용하지 않습니다.
현재 저희가 설계한 Core 는 Convolution 만 가능하죠.
좀 더 General 한 Core 를 설계해야, Convolution 뿐만아니라 Fully Connected 라던가 혹은 다른 연산들, PW, DW 등등 을 지원할 수 있어요. General 하게 지원하려면 행렬 연산 최적화가 더 중요할 것 같습니다.
그런 의미로, 이러한 CNN_CORE 를 사용하지 않는다 이해해주시면 될 것 같아요.
하지만 우리는 CNN_CORE 만 잘하면 된다, 라는 전제라면 사용할 수 있을 것 같아요.
FPGA 같은 경우에는 언제든지 설계 변경이 Programable 하기 때문에, 이런 "고정된 연산" 을 사용하기에 적합할 것 같습니다.
즐공하세요 :)
답변 1