fine tuning에 대한 개념적 이해
63
投稿した質問数 10
안녕하세요 강사님
강의 잘 듣고 있습니다.
강의 내용중 좀 더 이해하고 싶은 부분이 생겨 질문드립니다.
#질문 1
8분53초의 화면상의 ppt 슬라이드를 보면
행렬의 shape를 (a,m ), (m *n ), (a, n) 적어주셨는데 각각의 의미가 궁금합니다.
(a,m) 은 무엇을 의미하는 행렬이며
이때 a,m각각은 무엇을 나타내는지,
(m*n) 행렬은 무엇을 의미하는 행렬이며
m,n은 무엇을 나타내는지
(a,n) 행렬은 무엇을 의미하는 행렬이며
a,n은 무엇을 나타내는지.
( 제 추측으론, m은 모델의 vocabulary 사전의 개수. 또는 토큰id의 max값 같기도하고...n은 벡터의 길이 같기도하고....)
#질문 2
그리고 파인 튜닝을 위해 qlora n*n 행렬이 그림상에 추가되었는데, 개념적으로 데이터가 추가되었다고는 이해되는데 실제 물리적으로는 데이터가 어떻게 추가된것인지 궁금합니다.
단순히 m*n 행렬에 n행이 추가되어
m+n, n 행렬이 되었다든지...
回答 0
Docker + Spring Boot CI/CD 방법
0
3
1
마크다운을 텍스트 파일로 변환하기
0
15
1
docker compose에 대해 질문드립니다.
0
10
1
18강 smithery 를 이용한 mcp 실습(업데이트 요청)
0
17
1
guardrails 부분도 현재버전과 약간 다릅니다.
0
20
1
smithery ai 언제 업데이트 되나요?
0
17
1
무료할당량 사용하는데 문제가 생겼습니다.
0
21
1
섹션2-11 내용중 tool_call
0
25
2
max token을 제한하는게 왜 성능을 개선하게 되는걸까요?
0
42
2
20강에서 파인튜닝 때 사용한 데이터가 없어졌습니다. LoRA Trainer 매개변수도 라이브러리 업그레이드로 수정되었습니다.
0
20
1
JPA Repository 질문이 있습니다!
1
33
2
페이지네이션 처리를 쿼리에서 하는 방식 질문
1
36
1
디바이스 페어링 문의
0
32
2
gradio 를 통한 챗봇 인터페이스 실습이 진행되지 않습니다.
0
46
1
yml 작성하다가 에러 발생해서 문의 드립니다.
0
39
2
(강의 6분 50초 부분) Workspace 안에 index.html이 비어있음
0
35
2
섹션2. 1.5쿠버네티스_컨트롤플레인_노드와_워커_노드_그리고 kubeadm으로 쿠버네티스 직접 구성하기-v1.30 오류
0
36
2
강의순서가 바뀌어 있습니다.
0
36
1
설치수업중에 질문드립니다.
1
58
2
pc에서는 괜찮은데 탭으로 들으니 화면확대시 화면이 까맙니다
0
22
1
모든 자료 다운로드 누를때마다 똑같은 excel파일이 다운로드 받아짐. 노션 주소 공유되나요?
0
32
2
gemma 2 2b runpod 로컬 PC 사양
0
75
2
stop button 이 안보이는데요?
0
44
1
이 강의를 들으면 쇼핑몰 챗봇도 커버가 가능하나요?
0
58
1

