inflearn logo
강의

Khóa học

Chia sẻ kiến thức

Từ cơ bản về Spring AI mới nhất cho đến MCP

챗봇 기능 구체화 (RAG)

46

KMC

43 câu hỏi đã được viết

0

강사님 그 gemini api 를 사용해서 챗봇 응답을 만들고 있습니다.

RAG 를 이용해서 만개의 레시피 사이트에 내용을 json 파일로 가져온 다음 Vector _store 에 저장하고

이거를 기반으로 사용자가 질문을 하면 그거에 맞는 레시피를 보여주고 미리 저장되어 있는 OCR을 통해 저장한 식재료 중에 부족한 식재료는 어떤 게 있고 이런걸 알려주는 기능을 만들었는데 (앱으로 카드 UI ) 형태로 보여줄려고 만들었습니다. 근데 이 기능이 무료 api 에서 는 한계가 있는건가요?

image.png

 

spring-boot chatgpt rag springai mcp

Câu trả lời 2

0

tootoo

안녕하세요 이진만 입니다

최근 gemini정책이 무료 api 사용에 대해 일 사용 limit 을 매우 적게 주고 있습니다

Gemini는 카드 등록 후 사용량에 따라 비용이 지불 됩니다 개발 용으로 사용한다면 월 비용은 매우 적게 지불 될 것입니다

 

Part2에 gemini 셋팅 한번 보시면 좋을거 같네요

 

결론적으로는 gemini api는 무료 사용으로는 한계가 있습니다

 

1

KMC

감사합니다.

0

communityai8509

안녕하세요, 인프런 AI 인턴입니다. KMC님.

작성하신 내용을 보니, Gemini API와 RAG(Recency Augmented Generation)를 활용하여 레시피 추천 및 식재료 관리 기능을 가진 챗봇을 개발 중이시군요. 사용자가 질문할 때 미리 저장된 데이터를 통해 적절한 정보를 제공하는 시스템을 구현하셨으며, UI 디자인까지 고려하고 계신 것 같습니다.

현재 문제가 발생하는 부분은 무료 API 사용으로 인해 발생하는 한계입니다. 이미지에서 보여주신 오류 메시지에 따르면, Google 서비스의 Gemini-2.0-flash 모델에 대한 요청 제한을 초과하였다는 것을 알 수 있습니다. 이는 HTTP 429 오류, 즉 “Too Many Requests” 오류로 나타나며, 제한된 API 사용량을 초과했을 때 발생합니다.

해결책 및 고려사항:

  1. API 사용량 업그레이드:

    • 무료 티어의 API는 호출 횟수나 시간별 제한이 있는 경우가 많습니다. 프로젝트의 요구사항이 더 많은 API 호출을 필요로 한다면, 상위 요금제를 고려하거나, 유사한 기능을 제공하는 다른 API를 탐색해보는 것도 하나의 방법입니다.
  2. API 호출 최적화:

    • API 호출을 최소화할 수 있도록 로컬 캐싱을 활용하는 방법을 고려하십시오. 동일한 요청에 대해 반복적으로 API를 호출하는 대신, 로컬 저장소에 결과를 저장하여 응답 시간을 단축할 수 있습니다.
  3. 오류 처리 및 리트라이 로직:

    • 오류가 발생했을 때, 지연 처리를 설정하거나 리트라이 정책을 통해 일정 시간 후 재시도하는 방법으로 일시적인 호출 제한을 피할 수 있습니다.
  4. 빌링 및 플랜 확인:

    • 해당 서비스의 플랜과 요금제를 확인하시고, 요구사항에 맞는 플랜으로 업그레이드하는 것도 고려해 보세요.

추가 정보를 더 필요로 하신다면, 인프런의 다른 질문과 답변도 꼭 확인해 보세요. 예를 들어, “API 호출 최적화 방법”에 대한 토픽은 현재 문제를 해결하는 데 실질적인 도움이 될 수 있습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

0

KMC

한번 물어봐 주시면 감사하겠습니다.

RateLimitError

0

13

2

안녕하세요 졸업프로젝트를 준비하는 학생입니다.!

0

14

1

수강기간즘연장해주세요

0

14

1

2.3 Agentic RAG 관련 질문이 있습니다.

0

18

2

안녕하세요 치킨 디도스 이벤트 보고 흉내내보려 들어왔습니다..

0

19

1

Google API에 Generative Language API 선택이 없습니다.

0

28

2

Serpapi 툴을 사용하려 하는데 검색이 안됩니다.

0

37

4

실무 내용 문의드려요

0

26

2

챌린지 인증은 어디서 하나요?

0

27

1

3강에서 api 키 연결시 에러가 납니다.

0

28

2

dotenv, langchain_community 로드가 되지 않습니다.

0

22

1

코드 질문

0

26

1

To-Do App

0

27

1

twitterdb 연결이 안돼요

1

30

2

학습자료는 어디서 받을 수 있을까요?

0

33

1

MCP 서버 설치 내용이 실제와 달라 좀 헷갈립니다.

0

50

2

MCP가 토큰을 낭비한다고 뒷쪽에서 설명해주셨는데요.

0

37

2

Kafka Cluster 구성도 질문

0

23

1

예제 파일 다운 불가

0

34

1

실습2_GPT기반_온라인_댓글_분류_자동.ipynb 파일 오류 있습니다.

0

26

1

시큐리티 필터 설정 질문입니다!

2

50

1

mcp 사용 여부

0

104

2

gpt 대답에 대한 궁금한점

0

87

2

localhost/go/setting/postgresql

0

89

1