inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

처음 해보는 맞춤형 LLM 만들기 – LoRA & QLoRA 파인튜닝 입문

QLoRA기반 llama3.1 및 llama2 파인튜닝 실습-1

20강에서 파인튜닝 때 사용한 데이터가 없어졌습니다. LoRA Trainer 매개변수도 라이브러리 업그레이드로 수정되었습니다.

45

spacenyi

작성한 질문수 2

0

QLoRA 시 데이터 교체 :
dataset = load_dataset("chukypedro/finetune", split="train")데이터가 없어져서,
dataset = load_dataset("chukypedro/finetune", split="train")로 대체하였습니다. 

허깅페이스 사이트 들어가서 검색해도 chukypedro/finetune데이터는 없습니다

LoRA Trainer에서 파라미터명이 바뀌었습니다.

trainer = Trainer(
    model=model,  # 학습할 모델
    args=training_args,  # 학습 설정
    train_dataset=tokenized_dataset,  # 학습 데이터
    # tokenizer=tokenizer,  # 텍스트 디코딩용(구버전 (4.45 이하))
    processing_class=tokenizer, # 최신 버전 (4.46 이상)
    data_collator=data_collator,  # 배치 구성 도우미
    compute_metrics=compute_metrics  # <-- 여기 추가
)

딥러닝 NLP 인공지능(ai) llm fine-tuning

답변 1

0

인프런 AI 인턴

안녕하세요, 인프런 AI 인턴입니다. spacenyi님, 질문해 주셔서 감사합니다.

LoRA & QLoRA 파인튜닝 입문 강의에서 말씀하신 두 가지 문제에 대해 해결 방법을 안내드리겠습니다.

1. 데이터셋 문제

말씀하신 것처럼 load_dataset("chukypedro/finetune", split="train")와 같은 데이터셋이 없어졌다면, 다른 공개 데이터셋을 사용하시거나, 직접 만든 데이터셋을 사용하셔야 합니다. Hugging Face의 데이터셋을 사용할 때는 권장되는 방법은 최신 검색 방법으로 원하는 데이터셋을 찾아 대체하는 것입니다.

Hugging Face의 Datasets 라이브러리를 사용하여:

from datasets import load_dataset

# 예시로, 다른 공개 데이터셋을 사용
dataset = load_dataset("dataset_name", split="train")

Hugging Face 데이터셋 라이브러리 페이지에서 원하는 주제나 목적에 맞는 데이터를 찾아보실 수 있습니다: Hugging Face Datasets

2. Trainer 매개변수 변경

라이브러리가 업데이트됨에 따라 파라미터 명이나 API가 변할 수 있습니다. 최신 버전의 Hugging Face transformers 라이브러리를 사용하실 경우, 명시된 대로 tokenizer 대신 processing_class 등으로 변경하시면 됩니다.

from transformers import Trainer

trainer = Trainer(
    model=model,  # 학습할 모델
    args=training_args,  # 학습 설정
    train_dataset=tokenized_dataset,  # 학습 데이터
    processing_class=tokenizer, # 최신 버전에서의 텍스트 디코딩용
    data_collator=data_collator,  # 배치 구성 도우미
    compute_metrics=compute_metrics  # 성능 평가 지표 설정
)

참고 링크

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.

현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

gws auth login에서 문제가 있어서 질문드립니다.

0

7

1

시스템 아키텍처를 강의에 나온 것 처럼 그리고 싶은데 공유 가능할까요?

1

10

2

PROJECT_STRUCTURE.md 파일 공유좀 해주세요

0

13

2

hostinger vps 사용중 질문입니다.

0

12

0

노션 사용권한 불편합니다.

0

11

2

클로드 코드에 붙여넣기후 편집 관련 질문입니다!

0

9

1

session이 점점 길어지면 어떻게 대처하나요?

1

15

1

자동화프롬프트 가져오기 에러

0

12

1

노션 사용 권한 없음

0

17

2

Google API에 Generative Language API 선택이 없습니다.

0

18

2

아무것도 안됨

0

11

1

윈 터미널의 클로드와 에디터의 터미널의 클로드에 관한 질문

0

10

1

output-styles 명령어 없어 지지 않았나요?

0

14

1

강의자료

0

14

1

Notion에서 이 페이지에 대한 사용 권한 없음

0

18

2

Serpapi 툴을 사용하려 하는데 검색이 안됩니다.

0

25

4

클로드 스킬 기능(hwpx 채우기)과 유사한 기능을 하는 다른 AI모델 문의

0

9

0

외부 프로바이더 질문이 있습니다.

0

23

2

pc에서는 괜찮은데 탭으로 들으니 화면확대시 화면이 까맙니다

0

34

1

모든 자료 다운로드 누를때마다 똑같은 excel파일이 다운로드 받아짐. 노션 주소 공유되나요?

0

52

2

타임아웃 문제

0

111

2

강의 버퍼링 문제

1

92

1

추가 강의는 언제 올라오나요?

0

102

1

OPT350 모델 페이지 주소 좀알려주세요

0

108

1