tool의 Output Size 관련 질문
35
작성한 질문수 2
MCP Server 나 langgraph 나 모두 tool 입니다. 만약 tool 에서 결과 값이 너무 많이 나오는 경우 어떻게 처리 해야 할까요?
예1) MCP Server의 "우리 회사 고객 정보중 매출 얼마 이상 되는 정보를 보여줘?" 라고 고객이 입력 했는데, 그 고객 정보가 10만명이 나와서 tool 의 결과가 너무 커 버리는 예)
DB의 Limit 등으로 어떻게 하더라도 다음 호출을 LLM이 잘 못해주는 경우가 있음.
예2) 슬랙의 채널을 보여줘 했을 때, 슬랙의 채널이 너무 많은 경우 ... 결국 전부다
예3) 소스코드를 분석해 줘
소스코드가 1만 - 2만 라인 되었을 경우
Tool 의 결과라도 양이 많으면 Summary를 하면서 계속 돌려야 하는게 효과 적일까요? 아니면 페이지 1, 2 등을 호출할 수 있게 어떻게 하던 LLM 에게 권한을 주는게 효과 적일까요?
더 괜찮은 방법이나 좋은 prompt 등이 있으시면 답변 부탁 드립니다.
감사합니다.
답변 1
0
안녕하세요! 좋은 질문 감사합니다.
개인적으로는 context window가 커진다고 하더라도, 해당 Context를 모두 활용하면 비용이나 속도 측면에서 효율이 떨어지기 때문에 추천하고 싶지는 않습니다.
그래서 각 케이스별로 답변을 드려보자면
우리 회사 고객 정보중 매출 얼마 이상 되는 정보를 보여줘?라는 질문은, 엑셀에 있는 데이터를 파싱해서 LLM을 호출하기 보다는, LLM에 해당 엑셀의 컬럼 정보를 넘겨주고, pandas 코드를 작성하게 한 후에, 해당 엑셀 파일을 pandas 코드를 활용해서 분석하는 걸 추천 드립니다.슬랙의 채널을 보여줘 했을 때, 슬랙의 채널이 너무 많은 경우 ... 결국 전부다는 어쩔 수 없이 모두 넣을 수밖에 없을 것 같습니다. 그러면 슬랙에 있는 모든 채널을 불러와서 LLM에게 전달하기 보다는, 슬랙 채널에 대한 메타데이터를 별도로 저장하고, 해당 메타데이터를 기반으로 채널명과 채널ID를 불러오는 편이 더 효율적일 것 같습니다.소스코드를 분석해 줘: 소스코드가 1만 - 2만 라인 되었을 경우는 왠지 효율이 떨어질 것 같습니다. 말씀하신 summary를 하기에는 소스코드를 분석해서 코드를 작성해야하는데 summary를 하면 오히려 성능이 안나올 것 같습니다. 소스코드 전체를 전달하기 보다는, 코드를 파악해서 필요한 부분만 적절히 전달하는 편이 성능에 유리할 것 같습니다.
요약하면 너무 긴 context를 넘겨주면 성능이슈가 있을 수 있어서, 가급적 작은 단위로 실행해 보는 것을 추천드립니다!
제공해주신 레포가 Windows 환경에 너무 비친화적입니다.
0
38
2
마크다운을 텍스트 파일로 변환하기
0
41
1
max token을 제한하는게 왜 성능을 개선하게 되는걸까요?
0
55
2
pyzerox 유니코드 에러
0
80
2
영상 메타데이터 생성 관련 LLM 활용 질문
0
76
1
종합부동산세 부분 tool 사용 질문 드립니다.
0
81
2
uv sync 파이썬 버전문제 onnxruntime
-1
119
2
MCP를 활용해서 간단한 에이전트를 만들어보세요
0
101
1
PDF 형식
0
72
1
5.3 langchain-mcp-adpater를 활용한 MCP 도구 사용 tool_list 지연 사유
0
96
2
3.6 human_in_the_loop 3rd case
0
83
1
summary 를. 시스템메세지에 추가하는 부분에 관하여
0
80
3
병렬 처리 중 retrieve 관련 궁금한 사항
0
80
1
query 에 대한 answer 결과값이 나오지 않습니다.
0
98
2
사람과 관련된 표현이 없는데 rewrite 로 이동하지 않는경우
0
80
1
retriever 관련 질문
0
66
1
인터룹 관련 질문
0
51
2
2.4 Self-RAG 결과가 달라요!
0
80
2
md vs txt 차이..
0
151
2
OpenAI API 호출 때문에 발생하는 Error code: 429 문제
0
125
2
단순 도구 사용과 도구를 가진 에이전트를 사용하는 것의 차이가 궁금합니다.
0
90
1
LangChain과 LangGraph v1
0
142
1
2.4 강의 관련 질문(답변을 검증하는 self rag)
0
77
2
후속강의 문의
0
75
2





