좋은 강의 감사합니다. 궁금한게 있어 질의 드립니다.
68
投稿した質問数 70
# 모델을 로드하는 코드
model_id = "/work/checkpoints/hf/Qwen2.5-VL-3B-Instruct" # 사용할 모델 경로 지정
model_org = Qwen2_5_VLForConditionalGeneration.from_pretrained(
model_id, # 모델 경로로부터 모델 불러오기
device_map="auto", # 자동으로 장치 설정 (예: GPU 사용)
torch_dtype=torch.bfloat16, # 모델의 데이터 타입을 bfloat16으로 설정 (메모리 최적화)
)
processor = AutoProcessor.from_pretrained(model_id) # 모델에 맞는 processor 불러오기
==> 질문 사항 (2개)
질문1) 위 코드에 동일한 모델을 model_org 와 processor 로 정의한 거 같은데 왜 이렇게 정의한 이유는 무엇인가요?
질문2) datacollator 는 모델마다 정의하는 방법이 다른 거 같은데 현재 샘플로 주신 모델은 어디를 참고해야 하나요?
回答 1
0
안녕하세요, 인프런 AI 인턴입니다. 내일은 한걸음 더 나아갈거야님.
주신 질문에 대한 답변을 드리겠습니다. 모델을 로드할 때 model_org와 processor를 따로 정의하는 이유와 datacollator에 대한 설명을 각각 드리겠습니다.
질문1) 동일한 모델을 model_org와 processor로 정의한 이유
model_org와 processor를 따로 정의하는 이유는 다음과 같습니다:
Model (
model_org): 모델 자체는 주어진 입력에 대해 예측을 수행하는 역할을 합니다. 즉, 데이터가 입력으로 들어왔을 때 모델이 학습한 내용을 바탕으로 결과를 출력합니다. Qwen2.5-VL과 같은 모델은 이미지와 텍스트 데이터를 동시에 다룰 수 있는 특성을 가지고 있습니다.Processor: 프로세서는 모델에 데이터를 올바르게 전달하기 위해 데이터 전처리를 관리하는 역할을 합니다. 텍스트와 이미지를 모델이 이해할 수 있는 형식으로 변환하고, 필요시에는 모델이 생성한 출력을 해석하는 데에도 사용됩니다.
따라서, 모델과 프로세서가 따로 정의되어 동작하지만, 서로 상호 보완적인 역할을 수행한다고 볼 수 있습니다.
질문2) datacollator 정의 방법
datacollator는 데이터 배치를 보다 효과적으로 만들기 위한 방법입니다. 주어진 모델에서 사용할 datacollator를 정의하는 방법은 사용하는 라이브러리와 모델에 따라 다를 수 있습니다. 일반적으로 Hugging Face의 Transformers 라이브러리를 사용할 경우, 다음과 같이 사용할 수 있습니다:
- 당신이 사용하는 모델의 공식 문서나 예제 코드를 참고하여
DataCollator를 어떻게 설정해야 하는지 확인하세요.
DataCollator는 기본적으로 배치 내의 각 데이터를 모델이 사용할 수 있는 형태로 맞춰주며, 랜덤 마스크 생성이나 다른 데이터 변형 작업을 수행할 수도 있습니다.
샘플 모델을 위한 datacollator를 정의하려면 공식 Hugging Face 문서를 참고하시고, 모델에 따라 제공되는 예제 코드를 활용하여 최적의 설정을 찾아보세요.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.
마크다운을 텍스트 파일로 변환하기
0
14
1
import torch가 안되는 경우는 어떻게 하나요?
0
16
1
혹시 강의에 사용된 Agent 소스와 md 파일 구성을 좀 알 수 있을까요?
1
26
2
max token을 제한하는게 왜 성능을 개선하게 되는걸까요?
0
42
2
현재 강의에 사용하신 md 파일이 무척이나 궁금합니다.
1
49
2
섹션3 강의들의 나오지 않습니다.
1
46
1
강의 영상 오류
0
58
1
미션 마감일시를 좀 늘려주세요
0
45
1
개인브랜딩 사이트 만들기가 마감일시가 있었네요.
0
38
1
pyzerox 유니코드 에러
0
75
2
영상 메타데이터 생성 관련 LLM 활용 질문
0
72
1
MCP 연동 인텔리제이 2.6.1
0
120
2
종합부동산세 부분 tool 사용 질문 드립니다.
0
74
2
MCP 연동관련
0
132
4
클로드 개발자 구성편집 설정시 문제점
0
95
2
2025.3.3 인텔리제이 버전에서 MCP설정하는 방법
0
336
2
mcp 사용 여부
0
80
2
uv sync 파이썬 버전문제 onnxruntime
-1
106
2
Embedding 모델 fine tuning 관련 질문
0
71
2
gpt 대답에 대한 궁금한점
0
69
2
코드에 오타가 있는 것 같습니다
0
53
2
localhost/go/setting/postgresql
0
71
1
MCP를 활용해서 간단한 에이전트를 만들어보세요
0
97
1
PDF 형식
0
66
1

