20.08.20 16:48 작성
·
222
0
강의 코드를 돌려보았습니다.
제 노트북에는 nvidia gpu가 없기 때문에 cuda는 빼고 돌려 보았는데요, 자릿수 표현때문에 소숫점 이하 4자리까지 출력해봤는데요,
강의 내용과는 다르게 parallel_for가 가능 느린 결과가 나왔습니다.
add cpu 0.0185 sec
subtract 0.0187 sec
absdiff 0.0223 sec
parallel 0.2515 sec
이렇게 나왔습니다. 위의 결과는 4K 이미지로 테스트 한 것이고, 비교차원에서 여러 사이즈의 이미지들로 동일한 테스트를 해보았습니다. 매 번 parallel_for가 가장 안 좋은 결과가 나왔습니다.
opencv 라이브러리 설치할 때, tbb는 설치를 했습니다.
실제 이런 결과가 나올 만한 원인이 있을까요?
답변