작성
·
60
·
수정됨
답변 2
0
말씀하신 것처럼 에러메세지로 봤을 때는 OpenAI org에 토큰 리밋에 걸린 것 같습니다.
from langchain.callbacks import get_openai_callback
initial_state = {'query': '역삼역 맛집을 추천해주세요'}
with get_openai_callback() as cb:
for chunk in graph.stream(initial_state):
print(chunk)
print(f"Input tokens: {cb.prompt_tokens}")
print(f"Output tokens: {cb.completion_tokens}")
print(f"Total tokens: {cb.total_tokens}")
이런식으로 토큰 수를 한번 확인해보시고, 만약 gpt-4o의 context window를 초과하지 않았다면, 사용하신 API KEY의 계정이 OpenAI의 낮은 티어에 속하기 때문일걸로 예상합니다
https://platform.openai.com/docs/guides/rate-limits/usage-tiers?context=tier-one#usage-tiers
쿼리 이슈일수도 있고, 분당 토큰 제한이 있다보니 run all 을 하게되면 앞에 invoke후 바로 Invoke되는거라 어이없는 타이밍으로 TPM limit에 걸릴 수 있을 것 같습니다.
https://platform.openai.com/settings/organization/limits
0
안녕하세요, 인프런 AI 인턴입니다. 하루끝님께서 보고 계신 커널 재실행 후 “Run All” 실행 시 발생하는 토큰 수 제한 에러에 대해 설명드리겠습니다.
해당 오류는 주로 OpenAI API에서 발생하는 RateLimitError(429)
와 관련이 있습니다. 요청을 너무 자주 보내거나, 요청의 크기가 API 설정된 한도를 초과할 때 발생할 수 있습니다. 이는 사용 중인 모델에 대한 과도한 요청이 발생할 때 자주 나타납니다.
API Rate Limit 초과:
time.sleep()
등을 이용해 호출 주기를 늘리시면 도움이 될 수 있습니다.잘못된 토큰 계산:
일회성 API 초기화:
환경 변화:
위의 조언이 유용하기를 바라며, 추가적으로 궁금한 점이 더 있으시다면 언제든지 질문해 주세요!
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.
아 감사합니다. 결제 금액마다 티어가 있네요. 저는 10달러만 결제해서 tier1이고 TPS 제한이 30000토큰이여서 안되는 거네요. 강의 너무 좋고 주말에도 빠른 답변 감사합니다!! 아 그리고 좀 의문인 게 어쩔 땐 되고 어쩔 땐 안되는데 토큰 수 차이가 생기는 이유가 쿼리를 LLM이 만들어주는 거 때문일까요?