max token을 제한하는게 왜 성능을 개선하게 되는걸까요?

Question

안녕하세요 강의 잘 듣고있습니다. 제목 그대로 max token이 어떻게 hallucination 성능을 개선한건지 궁금합니다.

제이쓴 · Answer

안녕하세요! 좋은 질문 감사합니다. 수치를 통해 증명된 바는 없지만 경험상 GPT 모델들이 장황하게 부연설명을 많이하는데 그러면서 잘못된 내용이나 원하지 않는 내용들이 포함되는 경우가 많다고 생각합니다. 강의에서 말씀드리는 상황에서는 짧은 답변을 통해서 다음 단계로 넘어가는 상황에 max_tokens를 활용해서 답변의 길이를 제한하고 이를 통해 불필요한 내용이 답변에 포함되는 할루시네이션을 어느정도 방지할 수 있다고 보시면 됩니다

인프런 AI 인턴 · Answer

안녕하세요, 인프런 AI 인턴입니다. toy님. max token 설정이 모델의 성능과 hallucination 현상 완화에 미치는 영향을 이해하는 것은 매우 중요합니다. 이제 이에 대해 설명해드리겠습니다. Max Token Limit 설정이 성능에 미치는 영향 응답의 명확성 향상 : max token을 제한하면, 모델은 더욱 간결하고 명확한 응답을 생성하게 됩니다. 이는 길고 복잡한 응답에서 발생할 수 있는 엉뚱한 내용이나 오류 발생을 줄이는 역할을 합니다. 부정확한 답변 방지 : 제한된 토큰 내에서 응답을 만들어야 하므로, 모델은 더욱 관련성 높은 데이터를 사용하여 답변을 생성합니다. 이러한 과정을 통해 hallucination(실제로 없는 정보를 생성하는 현상)을 줄일 수 있습니다. 연산 효율성 강화 : 모델이 짧은 메시지에 집중하도록 함으로써 연산 자원을 효율적으로 사용하게 됩니다. 이는 처리 속도를 높이고 자원의 낭비를 막아 성능을 향상시킵니다. 관련 질문 및 해결 방법 과거 다른 학습자들도 비슷한 고민을 했었습니다. 그 과정에서 나왔던 유익한 답변들을 참고하시면 도움이 될 것입니다. 아래의 링크에서 자세한 내용을 확인하실 수 있습니다. 2.4 생성된 답변을 여러번 검증하는 Self-RAG 강의 에서 질문드립니다. : max token을 설정할 때의 유용한 팁과 사례. 2.4 강의 관련 질문(답변을 검증하는 self rag) : 답변의 일관성과 자동화된 검증 전략에 대해 논의된 글. 저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.