강의

멘토링

로드맵

인프런 커뮤니티 질문&답변

wbsoftdev님의 프로필 이미지
wbsoftdev

작성한 질문수

autotrain-advanced를 가지고 같은 모델로 계속 학습시키고 싶어요

작성

·

847

1

autotrain llm --train \
    --project_name "llama-add-mai" \
    --model "LDCC/LDCC-Instruct-Llama-2-ko-13B-v1.4" \
    --data_path "korquad_prompt_da" \
    --text-column "text" \
    --use_peft \
    --use_int4 \
    --lora-r 16 \
    --learning_rate 2e-4 \
    --auto-find-batch-size \
    --num_train_epochs 1000 \
    --trainer sft \
    --block_size 4096 \
    --model_max_length 4096

autotrain을 실행할 때 처음에 허깅페이스에 있는 모델 이름을 적으면 학습하는 것은 강의를 통해 이해했습니다. 그런데 처음 위의 커맨드로 첫 번째 학습을 시키고 난 체크 포인트 폴더에서 어떤 파일을 지정해줘야 학습시킨 모델 가지고 와서 두 번째 학습을 시킬 수 있을까요??

답변 1

0

안녕하세요, wbsoftdev님. 모델을 계속해서 학습시키는 방법에 대해 궁금하신 것 같네요.

autotrain-advanced를 사용할 때, 첫 번째 학습이 완료된 모델을 두 번째 학습에서 사용하기 위해 지정하는 방법은 다음과 같습니다.

첫 번째 학습이 완료된 후, 체크포인트 폴더에서 가장 최근에 생성된 모델 파일을 찾아야 합니다. 모델 파일은 보통 .ckpt 확장자를 가지고 있습니다. 이 파일을 두 번째 학습에 사용할 모델로 지정해주어야 합니다.

예를 들어, 체크포인트 폴더에 model.ckpt-10000과 같은 모델 파일이 있다고 가정해보겠습니다. 그렇다면 두 번째 학습을 시키기 위한 커맨드는 다음과 같이 모델 파일을 지정하는 부분을 수정하면 됩니다.

autotrain llm --train \
    --project_name "llama-add-mai" \
    --model "체크포인트 폴더에 위치한 모델 파일(.ckpt 확장자)" \
    --data_path "korquad_prompt_da" \
    --text-column "text" \
    --use_peft \
    --use_int4 \
    --lora-r 16 \
    --learning_rate 2e-4 \
    --auto-find-batch-size \
    --num_train_epochs 1000 \
    --trainer sft \
    --block_size 4096 \
    --model_max_length 4096

위와 같이 두 번째 학습에 사용할 모델 파일을 지정하면, 이전 학습에서 학습된 모델을 바탕으로 두 번째 학습을 진행할 수 있습니다.

학습에 사용할 체크포인트 폴더에서 가장 최근의 모델 파일명을 찾아서 지정해주시면 됩니다. 저희는 모델 파일명까지 정확하게 알 수 없기 때문에 직접 지정해주셔야 합니다. 이점 착오 없으시길 바랍니다.

추가로 다른 질문이 있으시면 언제든지 말씀해주세요. 도움을 드리겠습니다. 감사합니다!

image

안녕하세요~! checkpoint폴더 안에 .ckpt 라는 확장자는 없고, pt 라는 확장자만 있는데 이중에서 어떤 모델로 지정해주어야 할까요?

wbsoftdev님의 프로필 이미지
wbsoftdev

작성한 질문수

질문하기