묻고 답해요
143만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결RAG를 활용한 LLM Application 개발 (feat. LangChain)
streamlit 프로젝트에서 tax.docx 파일이 없어도 되나요
streamlit 프로젝트에는 tax.docx 파일이 필요없는 이유가.. 파인콘을 사용하기 때문인가요. 궁금합니다..
-
미해결RAG를 활용한 LLM Application 개발 (feat. LangChain)
아래 파인콘 벡터스토어 추가 확인요청
가상환경에서 진행중이고, 파이썬 버전 3.13입니다. 파이썬은 3.10 이상이면 된다고 본 거 같은데 ㅠㅠ 이게 문제일까요. 에러 메시지중 simsimd가 무엇인지 ㅠㅠ
-
미해결RAG를 활용한 LLM Application 개발 (feat. LangChain)
파인콘 벡터스토어가 없다고 나옵니다 ㅠㅠ
파인콘으로 바꾸는 부분 도중에 에러가 납니다..아래 오류 메시지도 입력했습니다 ㅠㅠINFO: pip is looking at multiple versions of langchain-pinecone to determine which version is compatible with other requirements. This could take a while. Note: you may need to restart the kernel to use updated packages.WARNING: Ignoring invalid distribution ~angchain-core (c:\Users\alice\test-llm\test-llm\Lib\site-packages) WARNING: Ignoring invalid distribution ~angchain-core (c:\Users\alice\test-llm\test-llm\Lib\site-packages) ERROR: Ignored the following versions that require a different python version: 0.0.2 Requires-Python >=3.8.1,<3.13; 0.0.2rc0 Requires-Python >=3.8.1,<3.13; 0.0.3 Requires-Python >=3.8.1,<3.13; 0.1.0 Requires-Python <3.13,>=3.8.1; 0.1.1 Requires-Python <3.13,>=3.8.1; 0.1.2 Requires-Python <3.13,>=3.8.1; 0.1.3 Requires-Python <3.13,>=3.8.1; 0.2.0 Requires-Python <3.13,>=3.9; 0.2.0.dev1 Requires-Python <3.13,>=3.9 ERROR: Could not find a version that satisfies the requirement simsimd<4.0.0,>=3.6.3 (from langchain-pinecone) (from versions: 4.4.0, 5.0.0, 5.0.1, 5.1.0, 5.1.1, 5.1.2, 5.1.3, 5.1.4, 5.2.0, 5.2.1, 5.3.0, 5.4.0, 5.4.1, 5.4.2, 5.4.3, 5.4.4, 5.5.0, 5.5.1, 5.6.0, 5.6.1, 5.6.3, 5.6.4, 5.7.0, 5.7.1, 5.7.2, 5.7.3, 5.8.0, 5.9.0, 5.9.1, 5.9.2, 5.9.3, 5.9.4, 5.9.5, 5.9.6, 5.9.7, 5.9.8, 5.9.9, 5.9.10, 5.9.11, 6.0.0, 6.0.1, 6.0.2, 6.0.3, 6.0.4, 6.0.5, 6.0.6, 6.0.7, 6.1.0, 6.1.1, 6.2.0, 6.2.1) ERROR: No matching distribution found for simsimd<4.0.0,>=3.6.3
-
미해결RAG를 활용한 LLM Application 개발 (feat. LangChain)
학습 자료 질문
강의 진행 시 사용하는 PPT 자료는 어디에서 다운 받을 수 있나요?
-
미해결RAG를 활용한 LLM Application 개발 (feat. LangChain)
RateLimitError가 나서 질문 드립니다.
RateLimitError: Error code: 429 - {'error': {'message': 'You exceeded your current quota, please check your plan and billing details. For more information on this error, read the docs: https://platform.openai.com/docs/guides/error-codes/api-errors.', 'type': 'insufficient_quota', 'param': None, 'code': 'insufficient_quota'}}청크 사이즈도 많이 줄여서 하는데, 똑같은 에러가 나서 질문드립니다! 강의 영상이랑 똑같이 진행하고 있는데결제크레딧 카드가 12월5일부로 open-ai에서 결제가 안되서 급하게 부랴부랴 크레딧을 가지고 있는분께 크레딧이 얼마 없긴한 계정 빌려서 해보고 있는데도 rateLimiterror가 나오고 있습니다.위와같은 에러가 다른경우도 나는 경우가 있을까요?
-
미해결RAG를 활용한 LLM Application 개발 (feat. LangChain)
pinecone 환경변수
안녕하세요 pinecone 연동을 하려는데 계속 오류가 발생하여 질문드립니다.pinecone의 environment나 project-id로는 어떤 것을 입력해야 되나요?
-
해결됨RAG를 활용한 LLM Application 개발 (feat. LangChain)
데이터 전처리 관련
안녕하세요. 테이블 이미지를 GPT가 이해할 수 있는 문법으로 변환하는 과정을 사람이 직접 하지않고 소프트웨어를 통해 할 수 있나요? 일반적으로 이와 관련된 전처리를 어떤식으로 하는지 궁금합니다.
-
미해결RAG를 활용한 LLM Application 개발 (feat. LangChain)
학습 자료와 관련해 질문 드립니다.
자주 질문 드리게 되어 죄송합니다.학습 자료로 올려주신 소스 코드를 활용하여 프로젝트를 진행해보고 싶어 문의 드립니다.올려주신 깃허브 코드를 오픈소스와 같이 활용해도 괜찮은 걸까요..?
-
해결됨RAG를 활용한 LLM Application 개발 (feat. LangChain)
HTML Rag
안녕하세요rag의 최적화 및 성능 향상을 위해 이것저것 알아보다 HTML구조가 Plain Text 보다 훌륭한 결과를 도출할 수 있다는 논문이 있어서 의견을 물어보고 싶습니다.https://arxiv.org/pdf/2411.02959논문에서는 HTML 형식이 일반 텍스트보다 우수한 성능을 보인다고 하고 있습니다. 저의 경우 데이터 수집을 크롤링으로 하고 있는데 만약 HTML이 더 우수하다고 한다면 굳이 html tag를 처리하는 노다가를 하지 않고도 오히려 더 좋은 성능이 나온다고 하니 솔깃한 마음이 있네요 또 강의에서는 표를 이해시키기 위해 마크다운 형식으로 전처리 작업을 했는데 이건 특정 모델마다 (ex openAI, Llama) 편차를 보이는지 궁금합니다
-
해결됨RAG를 활용한 LLM Application 개발 (feat. LangChain)
매번 선언에 대한 질문
안녕하세요 강사님 덕분에 최종예제를 따라서 어찌어찌 챗봇을 만드는데까지는 성공했습니다.이제 수행속도를 좀 올릴수 있는 방법이 없을까하다가..llm(업스테이지), 업스테이지 임베딩, 파인콘인덱스 등등get_***()함수에서 가져오다보니 질문을 한번 할떄마다 인스턴스를 생성하는 거 같더라구요.. 혹시llm(업스테이지), 업스테이지 임베딩, 파인콘인덱스 등등은 가장 바깥에 선언해두고 get_***()함수에서는 그냥 가져다 쓰면안되는건지 궁금합니다.
-
해결됨RAG를 활용한 LLM Application 개발 (feat. LangChain)
안녕하세요 강의 참고하여 개인 프로젝트 진행 중인데 질문이 있습니다.
개인 토이 프로젝트 진행중입니다. chroma db에 제가 저장하고 싶은 데이터를 저장하려하는데 mySQL과 같이 관계형 데이터베이스 형식으로 데이터 저장이 안되는지 궁금합니다. 첨부한 그림과 같은 데이터 구조인데, 회원에 따른 회원정보 임베딩 값을 크로마db에 저장하고 싶습니다. document_list에 회원정보를 list로 전달하고, ids를 회원 숫자 값으로 저장하려했는데 안되어서 질문 남깁니다
-
해결됨RAG를 활용한 LLM Application 개발 (feat. LangChain)
pinecone 질문입니다
database = PineconeVectorStore.from_documents(document_list, embedding, index_name=index_name)코드 실행시 오류가 발생합니다. PineconeApiException: (400) Reason: Bad Request HTTP response headers: HTTPHeaderDict({'Date': 'Sat, 23 Nov 2024 12:34:02 GMT', 'Content-Type': 'application/json', 'Content-Length': '104', 'Connection': 'keep-alive', 'x-pinecone-request-latency-ms': '3748', 'x-pinecone-request-id': '2915271834887315110', 'x-envoy-upstream-service-time': '5', 'server': 'envoy'}) HTTP response body: {"code":3,"message":"Vector dimension 4096 does not match the dimension of the index 3072","details":[]}초기 embedding 모델은 upstage 임베딩 모델을 사용했습니다. Pinecone index 생성시 기존 text-embedding-3-large 모델 선택했더니 dimension 기본값이 3064였는데 4096으로 변경했어야하는 부분인가요?
-
해결됨RAG를 활용한 LLM Application 개발 (feat. LangChain)
RetrievalQA Chain 문서 업데이트 오류
https://python.langchain.com/api_reference/langchain/chains/langchain.chains.retrieval_qa.base.RetrievalQA.html#langchain.chains.retrieval_qa.base.RetrievalQA 3.2강API 오류 발생하네요 upstage api 를 이용하는데 그 문제일까요?
-
해결됨RAG를 활용한 LLM Application 개발 (feat. LangChain)
텍스트 병합해서 사용하여도 되나요?
url에서 텍스트와 docx에 있는 텍스트를 각각 추출하여 split하고 하나의 객체로 통합해서 사용해도 성능이 잘 나올까요?
-
미해결RAG를 활용한 LLM Application 개발 (feat. LangChain)
배포시 버전 conflict 문제
제가 강사님 소스와 거의 같지만 다른게 upstage와WikipediaRetriever 를 쓴다는 것인데 이러면서 requirements.txt에서 계속 버전 충돌 에러가 나네요;; pip show 로 해서 충돌나는 버전을 visual studio code에 맞춰서 해도 계속 에러가 나네요 langchain-upstage 때문인것 같은데 이것 때문에 다른 라이브러리 전체의 버전을 다 바꿔야 하는 걸까요?
-
미해결RAG를 활용한 LLM Application 개발 (feat. LangChain)
배포시 에러
안녕하세요 강사님 항상 좋은 강의와 답변에 감사드립니다. 다름이 아니라 저는 upstage를 사용하는데요 requirements.txt에langchain-upstage==0.3.0 이렇게 넣으니까 에러가 나던데 이게 아닌건가요? pip install 에 보면 버전은 이게 맞는거 같은데요
-
미해결RAG를 활용한 LLM Application 개발 (feat. LangChain)
두가지 이상 문서를 넣고 싶을때는 어떻게 하나요?
안녕하세요~ 지난번에 gemini로 한다고 고전한다고 질문글을 남겼던 학생입니다. 그냥 openai로 다시 시작하니 실크로드마냥 뻥 뚫리더라고요.....기억나실지는 모르겠지만 지지난번에 남겼던 .env 문제도 해결했습니다. vscode에서도 그냥.env로 파일명 만들면 만들어지더라고요. 전엔 해당 확장자로 안 됐는데 어느순간 되는것이 이유를 모르겠습니다만... 아무튼 네 됐습니다. 그런데 (어쩌면 수업 외적인) 질문이 있는데요.만약에 제가 chatbot에 2개 이상의 문서를 넣고 싶으면 어떻게 해야되나요? 가령 소비자 보호법과 세법을 넣는다고하면 소비자보호법 관련 문서에는 이게 소비자 보호법이라는게 명시가 안 되어 있고, 세법 문서에는 해당 내용이 세법이라는 것에 대해 명시가 되어 있지 않아 1) 단순히 두 word파일을 하나의 파일로 합치면 혼란이 올 것 같은데, 2) 안 합치고 따로 하자니 일단 그 방법도 모르거니와 각각 넣는 게 파일명 말고는 1번과 무슨 차이인지도 모르겠어서 선생님께 질문을 드립니다. 비슷한 상황으로 다른 예시를 들어드리자면 , 가령 대출 관련 챗봇을 만드려고 할 때, 신용 대출에 대한 문서가 신용 대출 << 언급이 안되어 있는 아래와 같은 상황이고 [직장인 대출]금리 10%조건 : 1년이상 재직자대출한도: 만원[직장인 대출2]금리 9%조건 : 3년이상 재직자대출한도: 2만원[CSS 대출] 금리 11%조건 : 20세이상 30세 미만 대출한도: 3만원 그리고 주택 담보 대출은 아래와 같을 때, (= 대출 내용은 다르지만 대출을 받을 수 있는 컨디션은 똑같을 때)[a아파트 대출]금리 10%조건 : 1년이상 재직자대출한도: 50만원[주택 대출]금리 9%조건 : 3년이상 재직자대출한도: 60만원[버팀목 대출] 금리 11%조건 : 20세이상 30세 미만 대출한도: 70만원 이 상황에서 만약에 주택담보대출을 알아보고 있으면 굳이 신용대출까지 조회를 안 해도 되잖아요. 이런 상황은 어떻게 거르죠? 참고로 직장인 대출 <- 신용이라는 키워드로 거를수가 없습니다. 강의에서 알려주신 대로 데이터 사전이나 프롬포트를 이용해 처리하는 방법밖엔 없을까요? (생각나는 상황이 이런거인데 사실 대출을 잘몰라서 ;; 제 질문이 잘 전달됐는지 모르겠네요..) 아무튼 긴 글 읽어주셔서 다시 한 번 감사합니다.
-
미해결RAG를 활용한 LLM Application 개발 (feat. LangChain)
langsmith에서 openai 대신 upstage를 사용하는 방법
안녕하세요. upstage를 사용해 실습을 진행하던 중from langsmith.wrappers import wrap_openai 부분에서 막혀서 질문 드립니다.openai 대신 upstage를 사용하려면 어떤 라이브러리를 써야 하나요?
-
미해결RAG를 활용한 LLM Application 개발 (feat. LangChain)
pinecone specified an Api-Key오류
계속 upstage로 진행하고 있었습니다.이번에도 3.4.1 따라하다 막히는 부분이 있어서 3.4 부분을 보았더니 pc넣는것과 pincone api key 넣는것이 있어서 그부분을 확인 후에 다시 진행을 했습니다. 진행하면서 아래와 같이 오류가 나왔습니다. 오류 내용---> 58 raise PineconeConfigurationError("You haven't specified an Api-Key.") 59 if not host: 60 raise PineconeConfigurationError("You haven't specified a host.") 해당 코드 부분from langchain_pinecone import PineconeVectorStore # 데이터를 처음 저장할 때 index_name= 'tax-upstage-index' database = PineconeVectorStore.from_documents(documents=document_list, embedding=embedding).env내용OPENAI_API_KEY= UPSTAGE_API_KEY= LANGCHAIN_API_KEY= LANGCHAIN_TRACING_V2=true PINECONE_API_KEY= PINECONE_ENVIRONMENT=us-east-1 전체 코드%pip install python-dotenv langchain langchain-openai langchain-community langchain-text-splitters docx2txt langchain-chroma%pip install -qU langchain-pineconefrom langchain_community.document_loaders import Docx2txtLoader from langchain_text_splitters import RecursiveCharacterTextSplitter text_splitter = RecursiveCharacterTextSplitter( chunk_size=1500, chunk_overlap=200, ) loader = Docx2txtLoader("./tax.docx") document_list = loader.load_and_split(text_splitter=text_splitter)import os from dotenv import load_dotenv from langchain_upstage import UpstageEmbeddings # 환경변수를 불러옴 load_dotenv() pinecone_api_key = os.getenv("PINECONE_API_KEY") pinecone_environment = os.getenv("PINECONE_ENVIRONMENT") print("API Key:", pinecone_api_key) print("Environment:", pinecone_environment) # OpenAI에서 제공하는 Embedding Model을 활용해서 `chunk`를 vector화 embedding = UpstageEmbeddings(model='solar-embedding-1-large')결과 화면PINECONE_API_KEY: None PINECONE_ENVIRONMENT: None분명 .env에도 apikey를 공식 문서에 있는 내용을 가져와서 똑같이 붙여 넣고 했음에도 key값이 출력 나오지 않아, database부분이 진행이 되지 않고 있습니다.pincone default 키값이 문제인가 해서 새로운 key를 만들어 넣었습니다. 혹시 제가 하면서 놓친 부분이 있을까요?
-
미해결RAG를 활용한 LLM Application 개발 (feat. LangChain)
pinecone 관련 질문있습니다.
안녕하세요 오늘 파인콘 관련 강의를 들었는데요. pc = Pinecone(api_key= pinecone_api_key)pc = Pinecone(api_key= pinecone_api_key)이 부분 까지는 잘 되는데, database = PineconeVectorStore.from_documents(document_list, embedding, index_name = index_name) 이 부분을 실행하면 진행이 되지 않습니다.이런 메세지가 떠요.. gpt한테 물어봐서 아래와 같이 해서(제 환경에 맞게 수정함) 다시 돌려봤지만 결과적으로 마지막 database = PineconeVectorStore.from_documents(document_list, embedding, index_name = index_name)여기서 같은 오류가 뜨네요 ㅠㅠ 이 경우는 어떻게 해야될까요import pinecone from langchain.embeddings.openai import OpenAIEmbeddings from langchain.docstore.document import Document from langchain.vectorstores import PineconeVectorStore # 1. Pinecone 초기화 pinecone.init(api_key="your-api-key", environment="us-west1-gcp") # 2. 인덱스 생성 또는 불러오기 index_name = "example-index" if index_name not in pinecone.list_indexes(): pinecone.create_index(index_name, dimension=1536) # 3. 임베딩 모델 설정 embedding = OpenAIEmbeddings(openai_api_key="your-openai-api-key")