max token을 제한하는게 왜 성능을 개선하게 되는걸까요?
22
작성한 질문수 1
안녕하세요 강의 잘 듣고있습니다.
제목 그대로 max token이 어떻게 hallucination 성능을 개선한건지 궁금합니다.
답변 2
0
안녕하세요! 좋은 질문 감사합니다.
수치를 통해 증명된 바는 없지만 경험상 GPT 모델들이 장황하게 부연설명을 많이하는데 그러면서 잘못된 내용이나 원하지 않는 내용들이 포함되는 경우가 많다고 생각합니다.
강의에서 말씀드리는 상황에서는 짧은 답변을 통해서 다음 단계로 넘어가는 상황에 max_tokens를 활용해서 답변의 길이를 제한하고 이를 통해 불필요한 내용이 답변에 포함되는 할루시네이션을 어느정도 방지할 수 있다고 보시면 됩니다
0
안녕하세요, 인프런 AI 인턴입니다. toy님.
max token 설정이 모델의 성능과 hallucination 현상 완화에 미치는 영향을 이해하는 것은 매우 중요합니다. 이제 이에 대해 설명해드리겠습니다.
Max Token Limit 설정이 성능에 미치는 영향
응답의 명확성 향상: max token을 제한하면, 모델은 더욱 간결하고 명확한 응답을 생성하게 됩니다. 이는 길고 복잡한 응답에서 발생할 수 있는 엉뚱한 내용이나 오류 발생을 줄이는 역할을 합니다.
부정확한 답변 방지: 제한된 토큰 내에서 응답을 만들어야 하므로, 모델은 더욱 관련성 높은 데이터를 사용하여 답변을 생성합니다. 이러한 과정을 통해 hallucination(실제로 없는 정보를 생성하는 현상)을 줄일 수 있습니다.
연산 효율성 강화: 모델이 짧은 메시지에 집중하도록 함으로써 연산 자원을 효율적으로 사용하게 됩니다. 이는 처리 속도를 높이고 자원의 낭비를 막아 성능을 향상시킵니다.
관련 질문 및 해결 방법
과거 다른 학습자들도 비슷한 고민을 했었습니다. 그 과정에서 나왔던 유익한 답변들을 참고하시면 도움이 될 것입니다. 아래의 링크에서 자세한 내용을 확인하실 수 있습니다.
2.4 생성된 답변을 여러번 검증하는 Self-RAG 강의 에서 질문드립니다.: max token을 설정할 때의 유용한 팁과 사례.
2.4 강의 관련 질문(답변을 검증하는 self rag): 답변의 일관성과 자동화된 검증 전략에 대해 논의된 글.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.
0
max token을 모델의 inference 단계에서 미리 받는건가요?
다음 token을 내뱉을때 샘플링하는 temperature의 parameter를 수정하는것은 이해가 되는데, max token을 미리 설정하는건 좀 이해가 안가서요.
예시로 llm한테 1000자안으로 자소서를 작성해달라고 하면 항상 넘어가더라구요.
pyzerox 유니코드 에러
0
67
2
영상 메타데이터 생성 관련 LLM 활용 질문
0
62
1
종합부동산세 부분 tool 사용 질문 드립니다.
0
68
2
uv sync 파이썬 버전문제 onnxruntime
-1
98
2
MCP를 활용해서 간단한 에이전트를 만들어보세요
0
93
1
PDF 형식
0
59
1
5.3 langchain-mcp-adpater를 활용한 MCP 도구 사용 tool_list 지연 사유
0
86
2
3.6 human_in_the_loop 3rd case
0
79
1
summary 를. 시스템메세지에 추가하는 부분에 관하여
0
66
3
병렬 처리 중 retrieve 관련 궁금한 사항
0
72
1
query 에 대한 answer 결과값이 나오지 않습니다.
0
91
2
사람과 관련된 표현이 없는데 rewrite 로 이동하지 않는경우
0
70
1
retriever 관련 질문
0
61
1
인터룹 관련 질문
0
46
2
2.4 Self-RAG 결과가 달라요!
0
73
2
md vs txt 차이..
0
132
2
OpenAI API 호출 때문에 발생하는 Error code: 429 문제
0
110
2
단순 도구 사용과 도구를 가진 에이전트를 사용하는 것의 차이가 궁금합니다.
0
85
1
LangChain과 LangGraph v1
0
132
1
2.4 강의 관련 질문(답변을 검증하는 self rag)
0
70
2
후속강의 문의
0
70
2
3.6 강의 관련 질문(interrupt 관련)
0
48
1
그래프 구현 조언 부탁드립니다!
0
72
2
3.3 강의 에러 질문
0
111
1





