드립커피+한모금더님의 게시글

@onemoresipofcoffee

커리어인증

수강생: 9,839
수강평: 332
강의 평점: 4.9

게시글 65

질문&답변

ch .12 grid 설정 관련 질문 드립니다.

안녕하세요. AI 인턴이 답한 내용이 거의 완벽한 것 같습니다. core 가 보통은 SP를 의미하는데, 경우에 따라서는 SM의 의미로 쓰이기도 합니다. 어느 경우든, thread block 1개에서는 1024개의 thread만 실행 가능하다는 제약 때문에 1개의 SP 또는 1개의 SM 에 1만 개의 therad를 돌리기는 힘들다는 의미로 설명했습니다. 즉, 정확히 이해하신 것으로 보입니다. 감사합니다. ~

2025-12-21T01:34:38.456Z

좋아요수: 0
댓글수: 2
조회수: 87

질문&답변

강의에서 말씀해주신대로 폴더에 넣었는데 실행이 되지않습니다

안녕하세요. 해당 강의의 뒷부분에 연달아서 설명이 나옵니다만, DLL 파일을 찾지 못한다는 에러 메시지가 나오면, 해당 dll 파일 들을 C:\Windows\System32 폴더로 복사하면 해결됩니다. 강의 동영상에서도 설명하고 있습니다. ~

2025-09-13T13:06:21.123Z

좋아요수: 0
댓글수: 2
조회수: 104

질문&답변

memcpy 시간 고려 시 gpu vs. cpu

안녕하세요. 문제에 따라서 다를 수 있습니다. 실제 CUDA 로 풀었을 때의 시간을 memcpy + CUDA kernel + memcpy 시간으로 본다면, 문제가 어려워질수록, 사용하는 data 의 양이 많아질수록 CUDA 쪽이 유리해 집니다. CUDA를 사용하는 목적이, CPU 로는 시간이 너무 오래 걸리는 경우에 병렬 처리를 하자는 것이라는 점에 유의 하시면 되겠습니다. CPU와 GPU는 서로 다루는 문제의 종류나 사이즈가 다르다는 게 핵심이 될 겁니다. 감사합니다.

2025-08-07T06:20:35.900Z

좋아요수: 0
댓글수: 2
조회수: 97

질문&답변

cudaFree가 자동으로 되는 상황

안녕하세요. "프로그램" 이 종료되는 상황을 의미했습니다. ㅠㅠ 녹화 중에 발음이 명확하지 않았거나, 자막 처리가 잘못 된 것 같습니다. 감사합니다. ~

2025-08-05T02:20:18.636Z

좋아요수: 0
댓글수: 2
조회수: 90

질문&답변

MSB3721 오류

안녕하세요. 해당 에러는 CUDA 컴파일에 실패했다는, generic error code 라서, CUDA 설치나, 하드웨어 충돌 등을 검토해 봐야할 것 같습니다. 이미 인터넷에서 검색해 보셨겠지만, 비교적 최근에 비슷한 에러 상황을 당했던 사례로, 다음 링크를 참고해 보시면 도움이 될 것 같습니다. https://ccssbb.tistory.com/682 감사합니다.

2025-06-05T11:12:11.757Z

좋아요수: 0
댓글수: 2
조회수: 262

질문&답변

식별자 threadIdx 정의 되지 않음 오류

안녕하세요. AI 인턴의 대답이 정확하고, 아마도 컴파일러 세팅의 문제일 가능성이 큽니다. 컴파일이 되어서 실행까지 된다면, 아마도 nvcc 와의 연결 문제가 아닐까 싶습니다. 소스 코드에서 >> 은 꼭 연결해서, 3개가 연속되게 하시고, 컴파일러 쪽을 체크해 보시면 될 것 같습니다.

2025-05-02T23:26:27.918Z

좋아요수: 0
댓글수: 2
조회수: 240

질문&답변

cudaGetLastError() 에러 처리

네 맞습니다. 에러를 report 했다는 것을 처리했다고 표현했습니다. 감사합니다.

2025-03-16T23:18:08.685Z

좋아요수: 0
댓글수: 1
조회수: 151

질문&답변

CUDA Samples 없음

안녕하세요. 출장 관계로, 답변이 늦었습니다. 동영상 강의에는 추가 설명으로 들어가 있습니다만, CUDA 버전에 따라, samples 폴더가 같이 배포되는 경우도 있고, github 에서 별도 배포하는 경우도 있습니다. github 에 올려져 있는 samples 프로그램들을 사용하시면 됩니다. 검색해 보니, 다음 링크가 나오는 군요. https://github.com/NVIDIA/cuda-samples 감사합니다.

2025-03-01T22:51:34.925Z

좋아요수: 0
댓글수: 2
조회수: 202

질문&답변

24-2 3중 for loop 개선책 이해가 가지 않습니다.

안녕하세요. 24번 강의의 어느 부분을 말씀하시는 것인지 파악이 되지 않습니다. 좀더 자세하게, 몇번 슬라이드 설명인지를 알려주시면 도움이 될 것 같습니다. 감사합니다.

2025-02-24T06:02:11.815Z

좋아요수: 0
댓글수: 2
조회수: 143

질문&답변

transpose-shared.cu 가 느린 이유에 대해서 질문 있습니다.

안녕하세요. 해당 프로그램에서의 문제는 상당히 떨어진 memory를 요구하기 때문에 발생합니다. 원하는 메모리 address를 실제로 계산해 보면, 상당히 떨어진 memory 주소를 요구하니까, 완전히 새로 전체를 읽어오거나, 써야 하기 때문에 생기는 문제입니다. 어느 경우든, 캐쉬 메모리 관리가 전체 프로그램의 성능에는 예상보다 훨씬 큰 영향을 끼칩니다. 감사합니다.

2025-02-24T06:01:07.629Z

좋아요수: 0
댓글수: 2
조회수: 146