krag를 이용한 검색기법 평가관련 질문
75
投稿した質問数 9
안녕하세요.
krag를 통해 검색기법들을 평가하는 방법에서 질문이 있습니다.
이렇게 검색기법을 통해서 검색기에 대한 성능을 평가하려면, 우선적으로 question과 answer에 대한 평가셋을 직접 만들어야 하는걸까요?
回答 2
0
네, 맞습니다. 말씀해주신 것처럼 평가 데이터셋이 필요합니다.
일반적으로 해당 분야 전문가가 직접 만들어서 사용합니다. 강의에서는 데이터셋을 LLM으로 합성하고, 이를 전문가가 보완하는 시나리오로 설명드리고 있습니다.
0
안녕하세요, 인프런 AI 인턴입니다. 아이테킨님.
KRAG을 통해 검색기법을 평가하는 방법에 대해 질문해 주셨습니다. 검색기법의 성능을 효과적으로 평가하기 위해 평가셋을 준비하는 것은 매우 중요합니다. 이를 위해 다음과 같은 방법을 고려할 수 있습니다:
평가 셋 준비: 검색 시스템 평가를 위해 먼저
질문(question)과 이에 대한 적절한답변(answer)세트를 구성해야 합니다. 이는 검색 시스템이 얼마나 정확히 질의에 대한 답변을 제공하는지를 확인하는 데 필수적입니다.크라우드소싱 활용: 평가 데이터셋을 구축할 때, 크라우드소싱을 통해 다수의 사용자로부터 다양한 질문과 답변을 수집할 수 있습니다. 이는 데이터의 다양성과 현실적 유효성을 높이는 데 도움을 줍니다.
기존 평가 데이터셋 활용: 여러 기관이나 연구 커뮤니티에서 이미 공개한 평가 데이터셋을 활용하여 초기 테스트와 평가에 사용할 수 있습니다. 이를 통해 직접 데이터를 생성하는 시간을 절약할 수 있습니다.
평가 기준 정립: 검색 정확도, 적중률, 재현율 등 여러 가지 측정을 이용하여 검색기법의 성능을 평가할 수 있습니다. 각각의 평가 기준에 맞춰 데이터를 분석하는 방법을 설정하는 것이 중요합니다.
이러한 방법들로 평가셋을 구비하고, KRAG을 통한 검색기법의 평가를 진행할 수 있습니다.
해당 주제와 유사한 질문을 다룬 포스팅도 참고할 수 있습니다:
- 키워드 기반의 정보 검색의 한계에 관한 논의 - 검색의 정확성을 판단하기 위한 다양한 접근법에 대해 논의합니다.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.
테스트데이터셋 평가지표 값 문제
0
52
1
언어 감지 및 검색 라우팅
0
50
2
동영상이 검은 화면으로 나옵니다.
0
64
2
강의가 진행되지 않습니다.
0
65
2
'팀 단위 AI 업무 혁신' 자문 관련하여 문의드리고자 합니다. (연락처 요청)
0
53
1
Rerank에 대해 질문드립니다.
0
67
2
Cross Encoder Reranker 임포트 에러 관련 내용입니다.
0
101
2
HuggingFaceCrossEncoder 임포트 에러
0
81
2
아나콘다랑 pytry없이. 단순 파이참에서 venv 설정해서 설치하는건 불가능하나요?
0
80
1
2.7 전체 RAG파이프라인 구성에서 4번째 줄 오류
0
79
1
rag 와 랭체인
0
112
2
score 기반 서치
0
49
2
KR.txt파일이 없습니다.
0
77
2
MMR 관련 질문입니다.
0
83
1
Text_splitter관련 질문입니다.
0
59
2
오픈api key는 따로 구매해야되는 걸까요?
0
251
2
과거 채팅이력을 LLM에 줄때 포멧
0
72
1
OpenAIEmbeddings모델이 사용하는 토크나이저는 뭘까요?
0
170
2
ChatPromptTemplate의 from_messages로 메세지를 구성할 때 system은 어떻게 설정해야하나요?
0
95
2
create_retrieval_chain에서 context는 지정된 인자인가요?
0
62
1
vectorstore의 as_retriever와 similarity_search는 같은 로직인가요?, 사용되는 검색 알고리즘은 뭔가요?
0
91
2
evaluate_retrieval_at_K 함수 문의드립니다.
0
66
2
검색기 관련 질문드립니다.
0
87
2
2-3 임베딩모델 에러
0
168
2

