Chapter1에서 말하는 "모델"이 정확히 어떤건가요?
LLM의 모델이나 파운데이션 모델 이런 말에서 쓰는 "모델"이라는 단어가 정확히 어떤 뜻인지 궁금합니다.
답변 2
0
혹시 추천하실만한 입문서가 있으실까요?
0
안녕하세요. 모델이란 머신러닝 알고리즘을 구체화한 결과물이라고 생각할 수 있습니다. 하지만 추상적인 용어이기 때문에 문맥에 따라 조금씩 다르게 해석될 수 있어요. 신경망을 비롯해 대부분 머신러닝 알고리즘은 일종의 수학 함수를 찾는 과정이므로 모델을 하나의 거대한 수학 함수라고 생각할 수도 있습니다. 종종 모델을 훈련한다, 모델을 사용한다라고 말하기도 합니다. 이런 경우 모델은 프로그래밍 코드로 구현한 객체입니다. 예를 들어 Gemma 모델이란 구글에서 공개한 오픈소스 LLM 모델(추상적)을 지칭하거나 transformers 라이브러리에서 Gemma 모델의 가중치를 다운로드하여 생성한 파이썬 객체를 나타낼 수도 있습니다. 모델에 개념이 아직 확실치 않다면 머신러닝 입문서를 먼저 보면 좋을 것 같습니다. 감사합니다!
실습 코드
0
1
1
클라우드 가입 시 회사 이메일
0
7
0
엥?? 화면이 안나옵니다.
0
11
1
깃허브 레포지토리 확인 요청
0
23
2
Langchain 공식문서 학습 질문
0
25
2
나머지 강의는 언제 업로드되나요?
0
24
1
[참고] Cannot connect to host host.docker.internal:8080
0
27
2
40강 Multi GPU 필요성 설명이 두번 나오는 것 같아요
0
35
2
There are no longer any instances available with the requested specifications. Please refresh and try again.
0
59
2
버전에 3.11이랑 3.11.X 랑 차이가 있나요?
0
31
1
왜 파이썬 버전을 같게 해야하는가?
0
51
3
poetry 설정을 어떻게 해야하나요?
0
62
5
강의 수강 순서
0
54
1
import 오류
0
30
1
바흐다나우 어텐션을 시작하게 된 이유가 궁금해요!
0
68
2
누적입력에서 겹치는 방식으로 넘어간 이유
0
89
2
인증 하는 방법
0
89
2
7장 3절 이후는 언제 올리나요?
0
84
3
2.2 텍스트 토큰화 하기 강의 질문
0
62
1
챌린지 쿠폰 재 발급 가능 여부 확인 드립니다.
0
85
3
gpt_download 관련 오류 질의입니다.
0
77
2
책관련 질문입니다.
0
67
2
챕터 4 밑바닥부터 GPT 모델 구현하기 강의 업로드 문의드립니다.
0
91
2
슬라이딩 윈도우를 위해 for Loop 만들시 stride 관련 질문
0
110
2





