챗봇 기능 구체화 (RAG)
6
43 câu hỏi đã được viết
강사님 그 gemini api 를 사용해서 챗봇 응답을 만들고 있습니다.
RAG 를 이용해서 만개의 레시피 사이트에 내용을 json 파일로 가져온 다음 Vector _store 에 저장하고
이거를 기반으로 사용자가 질문을 하면 그거에 맞는 레시피를 보여주고 미리 저장되어 있는 OCR을 통해 저장한 식재료 중에 부족한 식재료는 어떤 게 있고 이런걸 알려주는 기능을 만들었는데 (앱으로 카드 UI ) 형태로 보여줄려고 만들었습니다. 근데 이 기능이 무료 api 에서 는 한계가 있는건가요?

Câu trả lời 2
0
안녕하세요 이진만 입니다
최근 gemini정책이 무료 api 사용에 대해 일 사용 limit 을 매우 적게 주고 있습니다
Gemini는 카드 등록 후 사용량에 따라 비용이 지불 됩니다 개발 용으로 사용한다면 월 비용은 매우 적게 지불 될 것입니다
Part2에 gemini 셋팅 한번 보시면 좋을거 같네요
결론적으로는 gemini api는 무료 사용으로는 한계가 있습니다
0
안녕하세요, 인프런 AI 인턴입니다. KMC님.
작성하신 내용을 보니, Gemini API와 RAG(Recency Augmented Generation)를 활용하여 레시피 추천 및 식재료 관리 기능을 가진 챗봇을 개발 중이시군요. 사용자가 질문할 때 미리 저장된 데이터를 통해 적절한 정보를 제공하는 시스템을 구현하셨으며, UI 디자인까지 고려하고 계신 것 같습니다.
현재 문제가 발생하는 부분은 무료 API 사용으로 인해 발생하는 한계입니다. 이미지에서 보여주신 오류 메시지에 따르면, Google 서비스의 Gemini-2.0-flash 모델에 대한 요청 제한을 초과하였다는 것을 알 수 있습니다. 이는 HTTP 429 오류, 즉 “Too Many Requests” 오류로 나타나며, 제한된 API 사용량을 초과했을 때 발생합니다.
해결책 및 고려사항:
API 사용량 업그레이드:
- 무료 티어의 API는 호출 횟수나 시간별 제한이 있는 경우가 많습니다. 프로젝트의 요구사항이 더 많은 API 호출을 필요로 한다면, 상위 요금제를 고려하거나, 유사한 기능을 제공하는 다른 API를 탐색해보는 것도 하나의 방법입니다.
- 무료 티어의 API는 호출 횟수나 시간별 제한이 있는 경우가 많습니다. 프로젝트의 요구사항이 더 많은 API 호출을 필요로 한다면, 상위 요금제를 고려하거나, 유사한 기능을 제공하는 다른 API를 탐색해보는 것도 하나의 방법입니다.
API 호출 최적화:
- API 호출을 최소화할 수 있도록 로컬 캐싱을 활용하는 방법을 고려하십시오. 동일한 요청에 대해 반복적으로 API를 호출하는 대신, 로컬 저장소에 결과를 저장하여 응답 시간을 단축할 수 있습니다.
- API 호출을 최소화할 수 있도록 로컬 캐싱을 활용하는 방법을 고려하십시오. 동일한 요청에 대해 반복적으로 API를 호출하는 대신, 로컬 저장소에 결과를 저장하여 응답 시간을 단축할 수 있습니다.
오류 처리 및 리트라이 로직:
- 오류가 발생했을 때, 지연 처리를 설정하거나 리트라이 정책을 통해 일정 시간 후 재시도하는 방법으로 일시적인 호출 제한을 피할 수 있습니다.
- 오류가 발생했을 때, 지연 처리를 설정하거나 리트라이 정책을 통해 일정 시간 후 재시도하는 방법으로 일시적인 호출 제한을 피할 수 있습니다.
빌링 및 플랜 확인:
- 해당 서비스의 플랜과 요금제를 확인하시고, 요구사항에 맞는 플랜으로 업그레이드하는 것도 고려해 보세요.
- 해당 서비스의 플랜과 요금제를 확인하시고, 요구사항에 맞는 플랜으로 업그레이드하는 것도 고려해 보세요.
추가 정보를 더 필요로 하신다면, 인프런의 다른 질문과 답변도 꼭 확인해 보세요. 예를 들어, “API 호출 최적화 방법”에 대한 토픽은 현재 문제를 해결하는 데 실질적인 도움이 될 수 있습니다.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.
강의 내 자료는 별도로 제공하지 않나요?
0
6
0
교재 파일이나 실습자료 한번에 다운로드 받는 메뉴가 없나요
0
12
1
마크다운을 텍스트 파일로 변환하기
0
20
1
패키지 구분에 대해 궁금한게 있습니다
0
15
1
실습 안떠요
0
19
0
스프링부트 서버 에러나요
0
17
1
2026.04에 추가된 강의 시청 불가
0
30
1
혹시 강의에 사용된 Agent 소스와 md 파일 구성을 좀 알 수 있을까요?
1
29
2
Service Create/Update Record 운용과 Delete Record 미운용의 차이 질문
0
23
1
자료에 실습 데이터가 없어요.
0
18
1
인가 코드 발급(프론트 vs 백)
0
29
2
인텔리제이 MCP 서버 설정 관련
0
27
1
Sequence 관련 질문
1
32
2
Image Only Query
1
29
2
섹션2-11 내용중 tool_call
0
25
2
max token을 제한하는게 왜 성능을 개선하게 되는걸까요?
0
42
2
n8n Email Trigger(IMAP) 네이버 메일 연동 시 Published 이후 트리거 미동작 문제
0
48
2
프롬프트, 스킬, sub-agent
0
31
1
도메인 모델에서 관계와 규칙을 구분하는 방법
0
38
2
16 강의 메세지 retryCount의 의도
0
23
2
JPA Repository 질문이 있습니다!
1
34
2
mcp 사용 여부
0
82
2
gpt 대답에 대한 궁금한점
0
71
2
localhost/go/setting/postgresql
0
72
1

