[3.3 강의] Upstage를 사용한 RAG 구현 성공기 공유
안녕하세요.
시간 가는줄도 모를 만큼 강의를 재밌게 들으며 배워가고 있는 수강생입니다.
강의를 듣던 중 Upstage API 연동이 잘 되지 않아 QnA 게시판을 보았는데, 저를 비롯한 많은 분들께서 Upstage API를 사용하고 있다는 것을 알게되었고 연동 관련해서 어려움을 느끼시는 것 같아 제가 해결한 과정을 같이 공유해보고자 글을 적었습니다.
저도 배워가는 과정인지라 표현이 서툴거나 잘못된 내용이 있을 수 있어 강사님의 피드백도 같이 공유 받을 수 있다면 더욱 좋을 것 같습니다..!
제가 해결한 방법을 결론 먼저 말씀드리면 chunk_list 길이를 찍었을 때 100개 이내인 경우에는 코드가 정상 동작했다는 것입니다. (대부분의 코드는 강사님께서 작성하신 내용을 그대로 따라했습니다.)
# 에러 (chunk_list의 length가 100개 이상인 경우)
# chunk_list = split_text(full_text, 1500)
# 작동 (chunk_list의 length가 100개 미만인 경우)
chunk_list = split_text(full_text, 1700)위와 같이 split_text에서 1500으로 인자를 주었던 것을 1700으로 변경하면 chunk_list의 길이는 100개 미만이 되며, 이를 초과할 경우 400 ERROR 또는 add 작업 중 중간에 멈추며 에러가 발생했습니다.
따라서 저는 이러한 문제의 원인을 아래 내용이라고 추정하며 해결했습니다.
강의 촬영 당시 사용된 법률안에 비해 현재는 개정 등으로 인해 늘어난 문자열 수
1로 인해 인자값을 1500으로 주었을 때 강의 촬영 당시 대비 커져버린 chunk_list의 크기
2로 인해 chromaDB에 add 할 수 있는 개수가 100개 이상 초과하면 발생되는 오류
전체 코드 참고하실 분들은 아래 링크에서 참고하시면 좋을 것 같습니다.
Answer 1
0
안녕하세요, 인프런 AI 인턴입니다.
CodeHater님께서 공유해주신 Upstage API 연동 경험담과 해결 방법이 많은 학습자분들께 큰 도움이 될 것입니다. 특히, chunk_list의 길이를 조절하여 문제를 해결한 부분은 매우 실용적입니다.
보통 이러한 오류는 과도한 데이터 크기나 API 제한 때문에 발생할 수 있습니다. chunk_list의 크기뿐만 아니라, 개별 청크의 크기와 개수도 중요한 역할을 할 수 있습니다. 경우에 따라서는 텍스트 처리 과정에서 데이터 압축이나 필터링을 고려해 볼 수 있습니다.
강사님의 피드백 또한 더욱 효율적인 방법을 찾는 데 도움이 될 수 있습니다. 나중에 문제가 계속 발생할 경우, 스택 오버플로우와 같은 커뮤니티에서 유사한 경험을 공유하는 사람들의 조언을 구해보시는 것도 좋은 방법일 것 같습니다.
정확한 코드와 해결 사례를 GitHub와 같은 플랫폼에 공유해주셔서 다른 학습자 및 개발자들이 쉽게 참고할 수 있는 것도 큰 장점이라고 생각합니다. 앞으로도 좋은 학습 경험 공유해주시길 기대합니다.
감사합니다.
소득세법 docx 파일 공유 요청건
0
57
1
EXAONE 모델 불러오기 안되는 문제
0
82
2
[5.1 강의] LLM Evaluator에 Upstage를 사용하는 방법 + 변경된 Langsmith Docs를 참고하여 구현하는 방법 공유
0
99
2
강의 9에 QA관련된 import가 되지 않네요
0
106
2
🚨 python3.14 를 쓰고 계시면 chroma 에서 ConfigError 가 발생합니다.
1
191
1
강의와 책 관련 질문
0
84
1
문서 전처리 고민
0
106
1
RAG 배포 질문드립니다
0
92
1
강의 내용과는 별개로 궁금한 점이 있습니다
0
86
2
폐쇄망 챗봇 모델
0
87
1
AI agent 쿠폰
0
93
2
저는 왜 그대로 했는데 답변이 틀리게 나오는지 모르겠네요
0
98
2
langchain howto/sequence는 지금 doc 공식 사이트 어디서 확인할 수 있나요?
1
90
1
new_question에 대한 답 출력
0
71
2
랭체인 라이브러리
0
143
2
[LangGraph를 활용한 AI Agent 개발] 쿠폰 유효기간
0
104
1
postgresql의 pgvector 벡터는 어떤가요?
0
334
2
doc관련
0
126
2
load_dotenv() 실행 False
0
93
1
RAG 답변 개선을 위한 정답지 활용 구조 검토 요청
0
117
2
3.2 from langchain.chains ~ 에서 모듈을 찾지 못할 때.
1
395
2
강의 완료 오류
0
87
1
hub.pull 이슈
0
128
2
RAG 문서 관리 방법
0
103
2

