강의

멘토링

커뮤니티

인프런 커뮤니티 질문&답변

김혜지님의 프로필 이미지
김혜지

작성한 질문수

<밑바닥부터 만들면서 배우는 LLM> 깃허브 + 보너스 콘텐츠 해설

(유튜브) 1.4 트랜스포머 구조 소개

Chapter1에서 말하는 "모델"이 정확히 어떤건가요?

해결된 질문

작성

·

20

0

LLM의 모델이나 파운데이션 모델 이런 말에서 쓰는 "모델"이라는 단어가 정확히 어떤 뜻인지 궁금합니다.

답변 2

0

김혜지님의 프로필 이미지
김혜지
질문자

혹시 추천하실만한 입문서가 있으실까요?

박해선님의 프로필 이미지
박해선
지식공유자

제가 쓴 <혼자 공부하는 머신러닝+딥러닝>을 추천해 드립니다. 머신러닝 입문서 베스트셀러이고 재미있게 쓰여 있어서 끝까지 읽는데 도움이 되실거에요. :)

0

박해선님의 프로필 이미지
박해선
지식공유자

안녕하세요. 모델이란 머신러닝 알고리즘을 구체화한 결과물이라고 생각할 수 있습니다. 하지만 추상적인 용어이기 때문에 문맥에 따라 조금씩 다르게 해석될 수 있어요. 신경망을 비롯해 대부분 머신러닝 알고리즘은 일종의 수학 함수를 찾는 과정이므로 모델을 하나의 거대한 수학 함수라고 생각할 수도 있습니다. 종종 모델을 훈련한다, 모델을 사용한다라고 말하기도 합니다. 이런 경우 모델은 프로그래밍 코드로 구현한 객체입니다. 예를 들어 Gemma 모델이란 구글에서 공개한 오픈소스 LLM 모델(추상적)을 지칭하거나 transformers 라이브러리에서 Gemma 모델의 가중치를 다운로드하여 생성한 파이썬 객체를 나타낼 수도 있습니다. 모델에 개념이 아직 확실치 않다면 머신러닝 입문서를 먼저 보면 좋을 것 같습니다. 감사합니다!

김혜지님의 프로필 이미지
김혜지

작성한 질문수

질문하기