CUDA Programming (4) - C/C++/GPU Parallel Computing - Matrix Multiplication

22-4 tiled approach - tiled approach

kernelMatCpy에서는 __syncthreads가 필요없지 않나요

Resolved2023-12-09T06:39:17.935Z

229

javer965697

1 asked

제목 그대로 kernelMatCpy에서는 각 스레드 작업이 다른 스레드에 영향을 주지 않기 때문에 필요없을 것 같은데요. 실제로 __stncthreads()를 제거하고 돌려봐도 정상적으로 결과가 나오구요.
혹시 이런 경우라도 내부적으로 꼬일 수 있어서 사용하신 것인지 아니면 대부분의 shared memory로 복사해서 쓰는 경우에 필요하기 때문에 습관(?)차원에서 사용하신 것인지 궁금합니다.

c c++ cuda gpu 병렬-처리

Answer 1

onemoresipofcoffee

2023-12-09T08:50:01.516Z

안녕하세요.

해당 부분에서는 "습관"으로 생각하시면 되겠습니다.

많은 경우에, kernel 실행 후에, 다른 kernel 이 연달아 실행되거나, 말씀하신 대로, shared memory 에서 즉시 사용하거나 하는 경우가 많아서, 보통 습관적으로 sync threads 를 하는 편입니다.

꼼꼼하게 따져보면, 예제 프로그램에서는 불필요한 경우가 가끔 있습니다. 참고하십시오.

감사합니다.

코딩살구클럽 승인

2026-06-14T14:23:00.462Z

코딩살구클럽승인

2026-06-14T11:03:22.429Z

리눅스로 진행해도 될까요?

2026-06-12T14:50:32.390Z

코딩살구클럽 승인

2026-06-11T06:00:36.674Z

3-D 관련 질문

2026-06-09T17:11:58.486Z

코살구 회원가입 문의

2026-06-09T04:06:29.351Z

코살구 로그인 문제

2026-06-08T01:22:29.527Z

26년 1회차 기출 강의

2026-06-05T06:34:03.931Z

3-A 문제 풀이 관련 질문

2026-06-04T14:26:38.197Z

2-O 질문 있습니다

2026-06-04T10:44:32.696Z

2-T 문제에 관한 질문

2026-06-03T15:27:23.968Z

코딩 살구 클럽 접속 및 사용방법 문의

2026-06-03T02:21:47.387Z

기출문제

2026-06-02T13:52:30.429Z

안녕하세요~. 현재 코살코딩클럽 사이트가 접속이 안됩니다~

2026-06-02T02:18:43.738Z

코딩살구클럽 로그인문제

2026-06-02T01:57:03.203Z

정보처리기사 실기 zip

2026-06-01T03:44:23.613Z

데이터베이스 노션

2026-06-01T00:30:29.421Z

본 강의와는 상관없는 내용입니다만..

2026-05-30T08:43:26.434Z

수업노선자료파일 다운

2026-05-30T03:39:18.290Z

코딩 살구 클럽 로그인 문제

2026-05-28T11:40:59.443Z

24-2 3중 for loop 개선책 이해가 가지 않습니다.

2025-02-23T10:32:21.158Z

142

transpose-shared.cu 가 느린 이유에 대해서 질문 있습니다.

2025-02-23T06:20:01.630Z

144

소스 코드 에러 문의 드립니다

2023-11-19T01:51:16.457Z

348

global memory를 사용한 matrix copy 대비 global memory를 활용한 matrix transpose가 속도가 느린 이유가 궁금합니다.

2023-10-05T13:47:44.219Z

371