인프런 커뮤니티 질문&답변

하루끝

작성한 질문수

LangGraph를 활용한 AI Agent 개발 (feat. MCP)

2.5 웹 검색을 지원하는 Corrective RAG

커널 재실행 후 Run all 할 경우 에러

작성

수정됨

커널 재실행 직후 run all 하면 토큰 수 제한 에러가 뜹니다. 다시 run all하면 잘 실행되구요. websearch 후 generate의 query 찍어보면 토큰 수 제한 걸릴일이 없는 문장인데 왜이럴까요? websearch 후 generate의 query 값이 "쿼리입니다 === " 이 부분입니다.

프롬프트엔지니어링 llm ai-agent langgraph mcp

답변 2

제이쓴

지식공유자

말씀하신 것처럼 에러메세지로 봤을 때는 OpenAI org에 토큰 리밋에 걸린 것 같습니다.

from langchain.callbacks import get_openai_callback

initial_state = {'query': '역삼역 맛집을 추천해주세요'}

with get_openai_callback() as cb:
    for chunk in graph.stream(initial_state):
        print(chunk)

print(f"Input tokens: {cb.prompt_tokens}")
print(f"Output tokens: {cb.completion_tokens}")
print(f"Total tokens: {cb.total_tokens}")

이런식으로 토큰 수를 한번 확인해보시고, 만약 gpt-4o의 context window를 초과하지 않았다면, 사용하신 API KEY의 계정이 OpenAI의 낮은 티어에 속하기 때문일걸로 예상합니다

https://platform.openai.com/docs/guides/rate-limits/usage-tiers?context=tier-one#usage-tiers

하루끝

질문자

아 감사합니다. 결제 금액마다 티어가 있네요. 저는 10달러만 결제해서 tier1이고 TPS 제한이 30000토큰이여서 안되는 거네요. 강의 너무 좋고 주말에도 빠른 답변 감사합니다!! 아 그리고 좀 의문인 게 어쩔 땐 되고 어쩔 땐 안되는데 토큰 수 차이가 생기는 이유가 쿼리를 LLM이 만들어주는 거 때문일까요?

제이쓴

지식공유자

쿼리 이슈일수도 있고, 분당 토큰 제한이 있다보니 run all 을 하게되면 앞에 invoke후 바로 Invoke되는거라 어이없는 타이밍으로 TPM limit에 걸릴 수 있을 것 같습니다.

https://platform.openai.com/settings/organization/limits

인프런 AI 인턴

안녕하세요, 인프런 AI 인턴입니다. 하루끝님께서 보고 계신 커널 재실행 후 “Run All” 실행 시 발생하는 토큰 수 제한 에러에 대해 설명드리겠습니다.

문제 요약

해당 오류는 주로 OpenAI API에서 발생하는 RateLimitError(429)와 관련이 있습니다. 요청을 너무 자주 보내거나, 요청의 크기가 API 설정된 한도를 초과할 때 발생할 수 있습니다. 이는 사용 중인 모델에 대한 과도한 요청이 발생할 때 자주 나타납니다.

가능한 원인과 해결책

API Rate Limit 초과:
- 원인: API 호출이 너무 빈번하게 이루어지거나, API 키당 요청 할당량을 초과했을 수 있습니다.
- 해결 방법: 요청 간에 적절한 대기 시간을 삽입하거나, API 할당량을 확인하고 조절해 보세요. time.sleep() 등을 이용해 호출 주기를 늘리시면 도움이 될 수 있습니다.
잘못된 토큰 계산:
- 원인: Websearch 후 생성 단계에서 예상보다 많은 토큰이 사용된 것으로 보입니다. 이 경우, 특정 부분에서 토큰 사용량이 급증할 수 있습니다.
- 해결 방법: 전처리 단계에서 커널이 수행하는 작업의 효율성을 평가하고, 불필요한 토큰 사용을 피할 수 있도록 코드를 최적화하세요. 현재 사용 중인 데이터의 양이나 문자열이 실제로 API의 입력 제한 내에 있는지 확인하십시오.
일회성 API 초기화:
- 원인: 커널을 재실행하면서 API 초기화가 한 번 더 필요할 수 있습니다.
- 해결 방법: 각 실행 중 최초 API 호출 전에 초기 API 상태를 명시적으로 초기화하거나 기다림(interval)을 추가해 보세요.
환경 변화:
- 원인: Jupyter Notebook이나 실행 환경에서 성능 문제로 인한 일시적인 오류가 발생할 수 있습니다.
- 해결 방법: 다른 환경에서도 같은 문제를 재현할 수 있는지 검토해 보세요.

추가 정보

API 사용량을 확인할 때, OpenAI의 API 대시보드를 통해 현재 할당량과 사용량을 파악하고 초과 여부를 모니터링할 수 있습니다.

위의 조언이 유용하기를 바라며, 추가적으로 궁금한 점이 더 있으시다면 언제든지 질문해 주세요!

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

하루끝

작성한 질문수

전체 Q&A

질문하기