RAG 문서 관리 방법
103
8 asked
추가 질문 드립니다!
현재 업무지침 원본 문서에 챗봇용 추가 정보(예: 부연설명 등)를 직접 삽입하여 feeding 하고 있습니다.
다만, 업무지침이 매년 개정되다 보니, 개정 시마다 챗봇용으로 추가한 정보들을 새로운 버전에 다시 반영해야 하는 어려움이 있습니다. 특히 이런 문서 관리는 개발팀이 아닌 현업에서 해야 하는 부분이라 현업 관점에서 문서 버전 관리나 갱신을 보다 효율적으로 할 수 있는 방법이 있을지 조언을 구하고 싶습니다.
감사합니다.
Answer 2
0
안녕하세요! 상당히 중요한 고민인데요, 이런 이유로 인해서 저는 회사에서 에이전트 개발을 직접 하지 않고, 현업에서 직접 만들어서 개발할 수 있는 플랫폼을 만들어서 운영했었습니다.
문서 업데이트가 빈번한데 개발자가 업데이트를 처리해야하는 상황이라면, 현업(사용자)에게 해당 기능을 처리할 수 있는 인터페이스를 제공할 수밖에 없습니다. 다만 문서가 업데이트돼서 기존에 vector store에 저장했던 문서를 제거해야한다면, metadata에 문서의 이름이나 고유값 등등을 저장해두고, 해당 metadata를 활용해서 기존에 문서는 제거하고 새로운 문서로 embedding을 하는 방식으로 진행하셔야 할 것 같습니다.
0
안녕하세요, 인프런 AI 인턴입니다. rarexband님.
RAG를 사용하는 환경에서 문서의 갱신 및 버전 관리에 관한 효율적인 방법을 제안드립니다.
문서 버전 관리 및 갱신 방안
별도의 버전 관리 시스템 사용:
- Git과 같은 버전 관리 도구를 사용하여 문서의 변경 사항을 추적하고, 챗봇용으로 추가된 정보를 별도의 브랜치에 병합하는 방식으로 관리할 수 있습니다. 이를 통해 매년 개정되는 업무지침도 쉽게 비교하고 필요한 내용만 반영할 수 있습니다.
- Git과 같은 버전 관리 도구를 사용하여 문서의 변경 사항을 추적하고, 챗봇용으로 추가된 정보를 별도의 브랜치에 병합하는 방식으로 관리할 수 있습니다. 이를 통해 매년 개정되는 업무지침도 쉽게 비교하고 필요한 내용만 반영할 수 있습니다.
메타데이터 활용:
- 문서의 각 버전에 대한 메타데이터를 사용해 문서의 버전을 명시적으로 관리합니다. 새로운 버전이 배포될 때, 참조하며 이전 버전에서의 변경 사항을 쉽게 추적할 수 있습니다.
- 문서의 각 버전에 대한 메타데이터를 사용해 문서의 버전을 명시적으로 관리합니다. 새로운 버전이 배포될 때, 참조하며 이전 버전에서의 변경 사항을 쉽게 추적할 수 있습니다.
자동화 스크립트 작성:
- 문서 갱신 시, 새로운 버전에 대한 차이를 자동으로 식별하고, 필요한 경우 일부 정보(예: 부연 설명)를 자동 복사하도록 자동화 스크립트를 작성할 수 있습니다. 이를 통해 수작업을 줄일 수 있습니다.
- 문서 갱신 시, 새로운 버전에 대한 차이를 자동으로 식별하고, 필요한 경우 일부 정보(예: 부연 설명)를 자동 복사하도록 자동화 스크립트를 작성할 수 있습니다. 이를 통해 수작업을 줄일 수 있습니다.
변경 내용 요약 및 검토:
- 새로운 원본 문서를 수집한 후, 변경된 내용을 요약하여 자동으로 검토할 수 있는 기능을 추가하면 업무지침 개정 시 매번 챗봇용으로 추가한 정보를 어떤 방식으로 유지할지 쉽게 결정할 수 있습니다.
- 새로운 원본 문서를 수집한 후, 변경된 내용을 요약하여 자동으로 검토할 수 있는 기능을 추가하면 업무지침 개정 시 매번 챗봇용으로 추가한 정보를 어떤 방식으로 유지할지 쉽게 결정할 수 있습니다.
이 방법들을 조합하면, 문서 개정 시 더욱 손쉽게 정보를 갱신하고, 추가 작업의 부담을 줄일 수 있습니다. 이와 관련된 정보들을 찾아보시거나 기존에 제공된 반응을 참고하시면 더 실용적인 해결 방법을 발견하실 수 있을 것입니다.
아래는 유사한 상황에서 해결 방안이 논의된 링크입니다:
- 문서 전처리와 버전 관리에 대한 질문: 실시간 데이터와 문서의 전처리 방법과 관리 구조에 대한 설명이 포함되어 있습니다.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.
소득세법 docx 파일 공유 요청건
0
57
1
EXAONE 모델 불러오기 안되는 문제
0
82
2
[5.1 강의] LLM Evaluator에 Upstage를 사용하는 방법 + 변경된 Langsmith Docs를 참고하여 구현하는 방법 공유
0
99
2
강의 9에 QA관련된 import가 되지 않네요
0
106
2
🚨 python3.14 를 쓰고 계시면 chroma 에서 ConfigError 가 발생합니다.
1
191
1
강의와 책 관련 질문
0
84
1
문서 전처리 고민
0
106
1
RAG 배포 질문드립니다
0
92
1
강의 내용과는 별개로 궁금한 점이 있습니다
0
86
2
폐쇄망 챗봇 모델
0
87
1
AI agent 쿠폰
0
93
2
저는 왜 그대로 했는데 답변이 틀리게 나오는지 모르겠네요
0
98
2
langchain howto/sequence는 지금 doc 공식 사이트 어디서 확인할 수 있나요?
1
90
1
new_question에 대한 답 출력
0
71
2
랭체인 라이브러리
0
143
2
[LangGraph를 활용한 AI Agent 개발] 쿠폰 유효기간
0
104
1
postgresql의 pgvector 벡터는 어떤가요?
0
334
2
doc관련
0
126
2
load_dotenv() 실행 False
0
93
1
RAG 답변 개선을 위한 정답지 활용 구조 검토 요청
0
117
2
3.2 from langchain.chains ~ 에서 모듈을 찾지 못할 때.
1
395
2
강의 완료 오류
0
87
1
hub.pull 이슈
0
128
2
[3.3 강의] Upstage를 사용한 RAG 구현 성공기 공유
1
147
1

