inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

RAG를 활용한 LLM Application 개발 (feat. LangChain)

5.4 [업데이트] HuggingFace 오픈소스를 활용한 RAG Pipeline 구성

Ollama로 사용가능한 한글 임베딩, LLM 모델 추천

해결된 질문

5158

건호아범

작성한 질문수 3

0

안녕하세요. 좋은 강의 감사합니다.
강의를 참고하여 standalone PC(GPU 4090)에서
Ollama, Langchain으로 RAG를 구성하고 테스트하고 있는데요.
혹시 한글 인식이 성능이 좋은 Ollama 임베딩, LLM 모델 추천해주실 수 있을까요? 4090급 GPU를 사용하다 보니 모델 선택 범위가 제한적이네요.

즐거운 하루 되세요.

vector-database llm langchain rag openai-api

답변 3

1

제이쓴

ollama에는 한국어에도 정상적으로 작동하는 임베딩 모델은 발견하지 못했습니다. 허깅페이스에 있는 모델은 그래도 https://huggingface.co/intfloat/multilingual-e5-large-instruct 요게 제일 괜찮았는데, ollama에도 비슷한게 있네요. 한번 시도해보셔도 좋을 것 같습니다 https://ollama.com/jeffh/intfloat-multilingual-e5-large-instruct

0

건호아범

매번 빠른 답변 감사합니다.

0

제이쓴

화이팅입니다! 또 궁금한 점이 있으시면 질문으로 올려주세요~

0

제이쓴

허깅페이스 모델을 ollama에서 바로 돌릴 수 있는데, 해당 기능을 활용하시면 ollama로 구동할 수 있을것같습니다

 

https://www.linkedin.com/posts/julienchaumond_in-case-you-missed-it-last-week-you-can-activity-7254104128610611201-Xdk_?utm_source=share&utm_medium=member_desktop

0

인프런 AI 인턴

안녕하세요, 인프런 AI 인턴입니다.

GPU 4090을 사용하여 Ollama와 Langchain을 활용해 RAG를 구성하고 계신 것에 대해 감사드립니다. 한글 인식 성능이 우수한 임베딩과 LLM 모델에 대해 추천드리고자 합니다.

  1. 임베딩 모델:

    • Ko-SBERT: 한국어에 최적화된 임베딩 모델로, 범용적으로 뛰어난 성능을 자랑합니다. Hugging Face의 HanBert와 같은 한국어에 특화된 모델도 고려해보세요.
  2. LLM 모델:

    • YanOljA의 EEVE-Korean: 한국어 데이터셋으로 훈련된 모델로, 현재 한국어 LLM 중에서 높은 평가를 받고 있습니다. 이 모델은 Hugging Face에서도 활용 가능합니다. EEVE-Korean 모델 문서를 참고하셔서 활용해 보시기 바랍니다.

4090 GPU는 대형 모델을 구동하는 데 적합하지만, 모델의 크기와 최적화 여부에 따라 성능에 차이가 있을 수 있음을 유의하시기 바랍니다. 위 모델들은 일반적으로 한국어 처리에 뛰어난 성능을 보이나, 프로젝트에 맞는 최적의 설정을 찾기 위해 몇 가지 실험이 필요할 수 있습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

소득세법 docx 파일 공유 요청건

0

65

1

EXAONE 모델 불러오기 안되는 문제

0

89

2

[5.1 강의] LLM Evaluator에 Upstage를 사용하는 방법 + 변경된 Langsmith Docs를 참고하여 구현하는 방법 공유

0

104

2

강의 9에 QA관련된 import가 되지 않네요

0

111

2

🚨 python3.14 를 쓰고 계시면 chroma 에서 ConfigError 가 발생합니다.

1

200

1

강의와 책 관련 질문

0

87

1

문서 전처리 고민

0

111

1

RAG 배포 질문드립니다

0

95

1

강의 내용과는 별개로 궁금한 점이 있습니다

0

89

2

폐쇄망 챗봇 모델

0

94

1

AI agent 쿠폰

0

95

2

저는 왜 그대로 했는데 답변이 틀리게 나오는지 모르겠네요

0

102

2

langchain howto/sequence는 지금 doc 공식 사이트 어디서 확인할 수 있나요?

1

95

1

new_question에 대한 답 출력

0

74

2

랭체인 라이브러리

0

148

2

[LangGraph를 활용한 AI Agent 개발] 쿠폰 유효기간

0

106

1

postgresql의 pgvector 벡터는 어떤가요?

0

345

2

doc관련

0

128

2

load_dotenv() 실행 False

0

96

1

RAG 답변 개선을 위한 정답지 활용 구조 검토 요청

0

119

2

3.2 from langchain.chains ~ 에서 모듈을 찾지 못할 때.

1

406

2

강의 완료 오류

0

89

1

hub.pull 이슈

0

131

2

[3.3 강의] Upstage를 사용한 RAG 구현 성공기 공유

1

150

1