강의

멘토링

커뮤니티

인프런 커뮤니티 질문&답변

muonk님의 프로필 이미지
muonk

작성한 질문수

설계독학맛비's 실전 AI HW 설계를 위한 바이블, CNN 연산 완전정복 (Verilog HDL + FPGA 를 이용한 가속기 실습)

현업에서 CNN은 어떻게 구현하나요?

작성

·

798

1

좋은 강의 감사드립니다..

수강 중 의문점이 있어 문의드려요.

강의 중 [AI HW Lab2] CNN Verilog HDL Practice 1 (Simulation) - 문제설명편 ppt 의 약 9:14초 정도에서 "현업에서는 이러한 CNN_CORE를 사용하지 않아요" 라고 말씀하셨는데 그 뜻이 궁금합니다.

veriolg가 아닌 HLS 등을 사용해서 구현한다는 건지 ? 아님 다른 가속용 IP core를 사와서 구현한다는 뜻인지? 아닌 다른 뜻이 있는지 알고 싶습니다.

그 외에 현업에서 실제로 어떠한 방식으로 딥러닝 IP를 구현하는지 간단하게 설명 부탁드려도 될까요?

 

답변 1

0

설계독학맛비님의 프로필 이미지
설계독학맛비
지식공유자

안녕하세요 :)

"현업에서는 이러한 CNN_CORE를 사용하지 않아요" 라고 말씀하셨는데 그 뜻이 궁금합니다.

헷갈릴 여지가 있겠네요.

실제 NPU 를 설계하는 업체들은, 이렇게 "고정된 연산" 을 하는 Core 를 사용하지 않습니다.

현재 저희가 설계한 Core 는 Convolution 만 가능하죠.

좀 더 General 한 Core 를 설계해야, Convolution 뿐만아니라 Fully Connected 라던가 혹은 다른 연산들, PW, DW 등등 을 지원할 수 있어요. General 하게 지원하려면 행렬 연산 최적화가 더 중요할 것 같습니다.

그런 의미로, 이러한 CNN_CORE 를 사용하지 않는다 이해해주시면 될 것 같아요.

하지만 우리는 CNN_CORE 만 잘하면 된다, 라는 전제라면 사용할 수 있을 것 같아요.

FPGA 같은 경우에는 언제든지 설계 변경이 Programable 하기 때문에, 이런 "고정된 연산" 을 사용하기에 적합할 것 같습니다.

즐공하세요 :)

muonk님의 프로필 이미지
muonk

작성한 질문수

질문하기