인프런 커뮤니티 질문&답변
모델 인퍼런스 타임에 관여하는 요소
작성
·
216
0
안녕하세요
인퍼런스 타임에 미치는 파라미터가
Gflops로 보면 될까요? 결국 런타임에서 수행하는 연산량의 갯수가 인퍼런스 타임에 직접적으로 미치는 것이죠?
모델 사이즈는 엄청 연관된다고 볼 수 없는 것이죠?
답변 1
0
권 철민
지식공유자
안녕하십니까,
일반적으로 파라미터가 많으면 연산량이 많아지고, 인퍼런스 타임이 느려 집니다. 그리고 파라미터 갯수가 많으면 전반적으로 모델 사이즈가 증가합니다. 그래서 모델 사이즈와 인퍼런스 타임은 연관성이 있습니다.




