작성
·
847
1
autotrain llm --train \
--project_name "llama-add-mai" \
--model "LDCC/LDCC-Instruct-Llama-2-ko-13B-v1.4" \
--data_path "korquad_prompt_da" \
--text-column "text" \
--use_peft \
--use_int4 \
--lora-r 16 \
--learning_rate 2e-4 \
--auto-find-batch-size \
--num_train_epochs 1000 \
--trainer sft \
--block_size 4096 \
--model_max_length 4096
autotrain을 실행할 때 처음에 허깅페이스에 있는 모델 이름을 적으면 학습하는 것은 강의를 통해 이해했습니다. 그런데 처음 위의 커맨드로 첫 번째 학습을 시키고 난 체크 포인트 폴더에서 어떤 파일을 지정해줘야 학습시킨 모델 가지고 와서 두 번째 학습을 시킬 수 있을까요??
답변 1
0
안녕하세요, wbsoftdev님. 모델을 계속해서 학습시키는 방법에 대해 궁금하신 것 같네요.
autotrain-advanced를 사용할 때, 첫 번째 학습이 완료된 모델을 두 번째 학습에서 사용하기 위해 지정하는 방법은 다음과 같습니다.
첫 번째 학습이 완료된 후, 체크포인트 폴더에서 가장 최근에 생성된 모델 파일을 찾아야 합니다. 모델 파일은 보통 .ckpt
확장자를 가지고 있습니다. 이 파일을 두 번째 학습에 사용할 모델로 지정해주어야 합니다.
예를 들어, 체크포인트 폴더에 model.ckpt-10000
과 같은 모델 파일이 있다고 가정해보겠습니다. 그렇다면 두 번째 학습을 시키기 위한 커맨드는 다음과 같이 모델 파일을 지정하는 부분을 수정하면 됩니다.
autotrain llm --train \
--project_name "llama-add-mai" \
--model "체크포인트 폴더에 위치한 모델 파일(.ckpt 확장자)" \
--data_path "korquad_prompt_da" \
--text-column "text" \
--use_peft \
--use_int4 \
--lora-r 16 \
--learning_rate 2e-4 \
--auto-find-batch-size \
--num_train_epochs 1000 \
--trainer sft \
--block_size 4096 \
--model_max_length 4096
위와 같이 두 번째 학습에 사용할 모델 파일을 지정하면, 이전 학습에서 학습된 모델을 바탕으로 두 번째 학습을 진행할 수 있습니다.
학습에 사용할 체크포인트 폴더에서 가장 최근의 모델 파일명을 찾아서 지정해주시면 됩니다. 저희는 모델 파일명까지 정확하게 알 수 없기 때문에 직접 지정해주셔야 합니다. 이점 착오 없으시길 바랍니다.
추가로 다른 질문이 있으시면 언제든지 말씀해주세요. 도움을 드리겠습니다. 감사합니다!
안녕하세요~! checkpoint폴더 안에
.ckpt
라는 확장자는 없고,pt
라는 확장자만 있는데 이중에서 어떤 모델로 지정해주어야 할까요?