inflearn logo
강의

Course

Instructor

Understanding LLM Architecture and GPU Utilization Strategies for AI Beginners

Creating a Runpod GPU Server

There are no longer any instances available with the requested specifications. Please refresh and try again.

Resolved

80

logt

25 asked

0

 

image.png

 

안녕하세요 선생님.

강의 잘 듣고 있습니다. Runpod 옵션에 대해서 최신 사항을 갱신해야 될 것 같아요ㅠㅠ

 

만들어진 지 얼마 안된 강의임에도 불구하고 현재 Runpod 에서 CUDA versions 12.8 기준으로 선택할 수 있는 GPU 선택지가 거의 없습니다..

 

이유는 모르겠으나 RTX 4090, 5090 으로 생성 하려고 해도 아래와 같은 경고문만 뜨네요.

image.png

 

하는 수 없이 RTX PRO 6000 WK 으로 선택해서 진행 중입니다. 어제는 RTX 5080 이 선택 가능하길래, 이걸로 진행했다가 오늘 아침에 다시 restart하니까 에러가 뜨더라고요..

 

ps.

torch.OutOfMemoryError: CUDA out of memory. Tried to allocate 394.00 MiB. GPU 0 has a total capacity of 15.48 GiB of which 367.06 MiB is free. Including non-PyTorch memory, this process has 15.11 GiB memory in use. Of the allocated memory 14.24 GiB is allocated by PyTorch, and 501.88 MiB is reserved by PyTorch but unallocated. If reserved but unallocated memory is large try setting PYTORCH_CUDA_ALLOC_CONF=expandable_segments:True to avoid fragmentation.  See documentation for Memory Management  (https://pytorch.org/docs/stable/notes/cuda.html#environment-variables)

선생님 말씀대로 24GB 이상으로 골라야 하니,RTX 5080(16 GB VRAM)는 안되네요 ㅋㅋㅋ

 

gpu attention-model 인공지능(ai) transformer llm

Answer 2

1

hyunjinkim

안녕하세요 logt님

보니까 Unavailable 이라 뜨는게 CUDA 12.8 이 없어서 그런건 아닌 것 같고 그냥 GPU 가 모잘라서 그런것 같습니다.

제가 녹화할 당시에도 CUDA 12.8 골라도 Unavailable 뜨는게 많았습니다. 그때는 빨간색으로 떴었는데 지금은 회색이네요. 아마 동일한 현상인 것 같습니다.

image.png

지금 Community Cloud 존에 CUDA==12.8 필터해서 본건데 원래도 이정도이긴 했어요 ^^

 

 

1

communityai8509

안녕하세요, 인프런 AI 인턴입니다. logt님!

Runpod 옵션 관련하여 말씀주신 문제는 최신 GPU 자원의 빠른 변경과 부족서에서 기인한 것으로 보입니다. 이는 GPU 클라우드 컴퓨팅 서비스에서 가끔 발생할 수 있는 현상입니다.

문제 원인 및 해결 방안

  1. GPU 자원 부족: 인기 모델의 경우 많은 사용자들이 동일한 리소스를 사용하려고 하면서 자원 부족 문제가 발생할 수 있습니다.
  2. 알림 및 대기: Runpod을 빈번히 확인하여 원하는 GPU가 사용 가능해질 때까지 기다리거나, 알림 기능이 있다면 활성화해보세요.
  3. 대체 옵션 고려: 다른 GPU 모델을 사용하시는 것도 방법입니다. RTX PRO 6000 WK와 같은 대체 모델로도 목적을 충분히 달성할 수 있을 것입니다.
  4. 클라우드 다른 제공자 고려: Runpod 외에도 다른 클라우드 GPU 제공자가 있을 수 있으니, 비교 검토해보시길 권장합니다.

추가 링크 및 자료

아래는 관련성을 갖는 자료로, 자세한 설명과 더 많은 정보 탐색에 도움을 드릴 수 있습니다:

강의에서 사용하신 GPU 설정이 제한적이라면, 추후 강의 업데이트시 강사님께서 최신 이용 가능 옵션과 대체 방법을 반영하시리라 기대됩니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

canva 인증 관련 질문

0

10

1

fatal: repository 'https://github.com/gymcoding/my-marketplace.git/' not found

0

12

2

변수 설정 시에 질문입니다.

0

7

1

live server, korean 을 검색해도 아무것도 나오지 않음

0

10

0

퍼블릭시티를 ai agent 제미나이로 대채

0

18

2

섹션2-18

0

15

2

텔레그램 User Info 채널이 없어요.

0

19

0

커서질문

0

17

1

SUPABASE에서 AOI 선택여부

0

14

2

클로드 코드 터미널 사용시 git, git 허브 활용 법

0

22

1

최신 엔비디아 CUDA 아키텍처에서의 결정적 변경 사항

0

12

1

mcp.json파일 생성 X

0

19

2

강의 내용이 정신이없네요 ;;

0

42

2

안녕하세요 기획지망생으로 루키스님 UE5 기본으로 공부하고 있는 사람입니다. 질문있어서 Q&A 드립니다.

0

42

2

데이터구조1-번들,아이템, 변수에 제공되는 고객피드백 Tally양식

0

12

2

제 컴퓨터에서는 Claude's plan이 아래와 같이 나오는데 괜찮은 건가요?

0

23

2

5.3 강의에서 goal 설정하고 진행시 mia workspace에 저장이 안되는 이유가 궁금합니다.

0

18

2

안녕하세요~ 각 직원끼리 서로 대화를 주고 받게 하는방법도 강의에서 다루어지나요?

0

23

1

강의에서 사용하는 prompt

0

20

2

window 11 환경 + git bash 터미널 statusline 반영이 안됩니다 ㅠ

0

23

2

[참고] Cannot connect to host host.docker.internal:8080

0

52

2

40강 Multi GPU 필요성 설명이 두번 나오는 것 같아요

0

52

2

질문있는데요.. vLLM은 말씀하신 사양에 적용이되나요?

0

74

2

강의 영상 오류

0

95

1