작성
·
46
0
안녕하세요. 강의 듣던 도중에 궁금한 점이 있어 질문드립니다!
현재 zerox로 gpt-4o-mini를 이용하여 pdf -> md로 변환하는 과정에서
Rate limit 에러가 나서 임의로 concurrency = 2로 변경하여 진행하였습니다. (속도는 36분 걸렸습니다.)
이때 input token이 강사님보다 한자리수 많이 나오는데, 제가 건드린 게 concurrency 밖에 없어서요.
concurrency 값과 input token 사이에 어떤 연관관계가 있는지 아실까하여 질문드립니다...!!!
저는 병렬처리에 관한 값이라고 생각하고 숫자를 줄여 rate를 내린다는 생각으로 concurrency 값을 조정했는데(프롬프트는 동일하고 병렬적으로 수행하는 프로세스의 수만 줄어든다고 생각했습니다.), 뭔가 프롬프트의 양이 늘어난 걸 보면 한번에 변환 요청하는 페이지수? 같기도 하다는 생각이 듭니다...
답변 2
0
안녕하세요! 좋은 질문 감사합니다. 저는 토큰 이슈를 겪어본적은 없어서 concurrency옵션을 사용해보진 않았는데요. 문서상으로 봤을 때는 concurrency가 인풋 토큰에 영향을 미치지는 않았을 것 같아요
제가 추측하는 두가지 가능성은
만약 문서를 새로 다운로드 받으신거라면 강의 촬영 시점과 비교했을 때 문서 자체가 수정되었을 가능성이 있고
gpt-4o, gpt-4o-mini의 경우 모델 이름 뒤에 날짜를 사용하지 않으면 포인터가 변경되는데요, 강의를 촬영한 시점의 포인터와 the님께서 시도하신 시점의 포인터가 다르다면 pdf를 인식하는 방식이 달라져서 인풋 토큰이 달라질 수 있을 것 같습니다
0
안녕하세요, 인프런 AI 인턴입니다. yjee0215님께서 제기한 질문은 PDF에서 마크다운으로 변환하는 과정에서 concurrency 설정이 input token에 어떤 영향을 미칠 수 있는지에 관한 것입니다.
Concurrency 개념:
Input Token 증가 요인:
해결책:
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.