chroma vector db 생성에서 오류
안녕하세요. 지금 Chroma.from_documents(documents=document_list, embedding=embedding) 이 부분에서 에러가 나서 질문 드립니다.
개발 환경은 vscode에서 jupyter notebook 가상환경 만들어서 사용 중입니다.
사내에서 공부 중이라 drm으로 인해 txt 파일로 변경을 했고, ollama를 사용해서 embedding model을 생성했습니다. mxbai-embed-large 이 모델을 사용했고요.
일단 소요 시간이 너무 오래 걸립니다. 그리고 1시간이 넘어가고는 canceled future for execute_request message before replies were done 이 에러가 뜨더라고요. 그래서 python으로 작성을 했더니 2시간 정도 걸리니까 생성은 되더라고요. 이건 좀 아닌 거 같아서 질문 드립니다. 혹시 왜 이런지 아실까요?
답변 2
0
GPU가 있는 PC이고, cuda도 설치한 상태입니다. 혹시 다른 이유는 없을까요?
0
음 그런 상황이시면
쿠다가 잘 인식되는지 먼저 확인해보시고
쿠다가 잘 인식된다면 ollama가 gpu를 잘 쓰는지를 확인해보시고
ollama가 gpu를 잘 쓰고 있다면 메모리를 한번 확인해보셔야 할 것 같습니다
혹시 문서 용량은 어느정도 되나요?
0
안녕하세요,
Jupyter에서 발생하는 "canceled future" 에러는:
Jupyter의 기본 타임아웃 설정 때문일 가능성이 높습니다
긴 실행 시간을 요구하는 작업에서 자주 발생하는 문제입니다
그리고 소요시간이 오래걸리는 건 GPU가 없기 때문일 가능성이 높습니다. 경험상 ollama에 있는 임베딩 모델들은 한국어 대상으로 성능이 좋지 않아서, 학습 목적이시라면 더 작은 임베딩 모델을 사용해보시는 걸 추천드립니다.
소득세법 docx 파일 공유 요청건
0
63
1
EXAONE 모델 불러오기 안되는 문제
0
87
2
[5.1 강의] LLM Evaluator에 Upstage를 사용하는 방법 + 변경된 Langsmith Docs를 참고하여 구현하는 방법 공유
0
102
2
강의 9에 QA관련된 import가 되지 않네요
0
110
2
🚨 python3.14 를 쓰고 계시면 chroma 에서 ConfigError 가 발생합니다.
1
197
1
강의와 책 관련 질문
0
86
1
문서 전처리 고민
0
108
1
RAG 배포 질문드립니다
0
93
1
강의 내용과는 별개로 궁금한 점이 있습니다
0
87
2
폐쇄망 챗봇 모델
0
91
1
AI agent 쿠폰
0
94
2
저는 왜 그대로 했는데 답변이 틀리게 나오는지 모르겠네요
0
100
2
langchain howto/sequence는 지금 doc 공식 사이트 어디서 확인할 수 있나요?
1
92
1
new_question에 대한 답 출력
0
72
2
랭체인 라이브러리
0
145
2
[LangGraph를 활용한 AI Agent 개발] 쿠폰 유효기간
0
105
1
postgresql의 pgvector 벡터는 어떤가요?
0
341
2
doc관련
0
126
2
load_dotenv() 실행 False
0
93
1
RAG 답변 개선을 위한 정답지 활용 구조 검토 요청
0
117
2
3.2 from langchain.chains ~ 에서 모듈을 찾지 못할 때.
1
402
2
강의 완료 오류
0
87
1
hub.pull 이슈
0
129
2
[3.3 강의] Upstage를 사용한 RAG 구현 성공기 공유
1
147
1





