Chapter1에서 말하는 "모델"이 정확히 어떤건가요?
LLM의 모델이나 파운데이션 모델 이런 말에서 쓰는 "모델"이라는 단어가 정확히 어떤 뜻인지 궁금합니다.
Answer 2
0
혹시 추천하실만한 입문서가 있으실까요?
0
안녕하세요. 모델이란 머신러닝 알고리즘을 구체화한 결과물이라고 생각할 수 있습니다. 하지만 추상적인 용어이기 때문에 문맥에 따라 조금씩 다르게 해석될 수 있어요. 신경망을 비롯해 대부분 머신러닝 알고리즘은 일종의 수학 함수를 찾는 과정이므로 모델을 하나의 거대한 수학 함수라고 생각할 수도 있습니다. 종종 모델을 훈련한다, 모델을 사용한다라고 말하기도 합니다. 이런 경우 모델은 프로그래밍 코드로 구현한 객체입니다. 예를 들어 Gemma 모델이란 구글에서 공개한 오픈소스 LLM 모델(추상적)을 지칭하거나 transformers 라이브러리에서 Gemma 모델의 가중치를 다운로드하여 생성한 파이썬 객체를 나타낼 수도 있습니다. 모델에 개념이 아직 확실치 않다면 머신러닝 입문서를 먼저 보면 좋을 것 같습니다. 감사합니다!
마크다운을 텍스트 파일로 변환하기
0
11
1
import torch가 안되는 경우는 어떻게 하나요?
0
12
1
소리가 겹쳐서 들려요
0
19
2
18강 smithery 를 이용한 mcp 실습(업데이트 요청)
0
17
1
guardrails 부분도 현재버전과 약간 다릅니다.
0
18
1
smithery ai 언제 업데이트 되나요?
0
17
1
무료할당량 사용하는데 문제가 생겼습니다.
0
21
1
섹션2-11 내용중 tool_call
0
25
2
max token을 제한하는게 왜 성능을 개선하게 되는걸까요?
0
42
2
20강에서 파인튜닝 때 사용한 데이터가 없어졌습니다. LoRA Trainer 매개변수도 라이브러리 업그레이드로 수정되었습니다.
0
20
1
[개정판] 딥러닝 컴퓨터 비전 완벽 가이드 먼저? 구현하며 배우는 Transformer 먼저?
0
29
1
gradio 를 통한 챗봇 인터페이스 실습이 진행되지 않습니다.
0
46
1
전 강의와 전혀 이어지지가 않음
0
30
1
pytorch local 설치 옵션에 conda 가 없습니다.
0
38
3
바흐다나우 어텐션을 시작하게 된 이유가 궁금해요!
0
56
2
누적입력에서 겹치는 방식으로 넘어간 이유
0
81
2
인증 하는 방법
0
82
2
7장 3절 이후는 언제 올리나요?
0
70
3
2.2 텍스트 토큰화 하기 강의 질문
0
57
1
챌린지 쿠폰 재 발급 가능 여부 확인 드립니다.
0
75
3
gpt_download 관련 오류 질의입니다.
0
69
2
책관련 질문입니다.
0
58
2
챕터 4 밑바닥부터 GPT 모델 구현하기 강의 업로드 문의드립니다.
0
82
2
슬라이딩 윈도우를 위해 for Loop 만들시 stride 관련 질문
0
91
2

