묻고 답해요
169만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨RAG를 활용한 LLM Application 개발 (feat. LangChain)
gemini 오류관련 질문드립니다.
안녕하세요, 강의 반복중에 있습니다.이번에는 gemini로 RAG를 구축해보려고 하는데,API Key를 활성화했음에도 계속 하기와 같은 에러가 뜹니다.ㅠ 제가 놓친 부분이 있을까요?from langchain_google_genai import ChatGoogleGenerativeAI llm = ChatGoogleGenerativeAI( model="gemini-2.0-flash", temperature=0, max_tokens=None, timeout=None, max_retries=2, # other params... ) llm.invoke("인프런에 어떤 강의가 있나요?") --------------------------------------------------------------------------- PermissionDenied Traceback (most recent call last) Cell In[2], line 1 ----> 1 llm.invoke("인프런에 어떤 강의가 있나요?") File c:\Users\yunjeong2.lee\Desktop\VenvWorkspace\myenv\Lib\site-packages\langchain_google_genai\chat_models.py:1255, in ChatGoogleGenerativeAI.invoke(self, input, config, code_execution, stop, **kwargs) 1250 else: 1251 raise ValueError( 1252 "Tools are already defined." "code_execution tool can't be defined" 1253 ) -> 1255 return super().invoke(input, config, stop=stop, **kwargs) File c:\Users\yunjeong2.lee\Desktop\VenvWorkspace\myenv\Lib\site-packages\langchain_core\language_models\chat_models.py:372, in BaseChatModel.invoke(self, input, config, stop, **kwargs) 360 @override 361 def invoke( 362 self, (...) 367 **kwargs: Any, 368 ) -> BaseMessage: 369 config = ensure_config(config) 370 return cast( 371 "ChatGeneration", --> 372 self.generate_prompt( 373 [self._convert_input(input)], 374 stop=stop, 375 callbacks=config.get("callbacks"), ... metadata { key: "method" value: "google.ai.generativelanguage.v1beta.GenerativeService.GenerateContent" } ] Output is truncated. View as a scrollable element or open in a text editor. Adjust cell output settings...
-
해결됨RAG를 활용한 LLM Application 개발 (feat. LangChain)
LLM 애플리케이션과 AI Agent 차이점이 뭐에요?
개념상 똑같은거 같아요.예를들어 세무 전용 Agent 서비스가 있다고하면 결국 그게 LLM 서비스이고, LLM 애플리케이션이자, RAG 솔루션 아니에요? AI Agent = LLM 서비스 = LLM 애플리케이션 = RAG 솔루션 다같은말이에요?? 너무헷갈려요
-
해결됨RAG를 활용한 LLM Application 개발 (feat. LangChain)
데이터 전처리 관련 질문드립니다
"3.5 Retrieval 효율 개선을 위한 데이터 전처리" 강의에서 세율 데이터를 표로 LLM에 전달하다가마크다운으로 변경했는데 데이터를 읽어오지 못합니다표로 데이터를 전달했을 때는 데이터를 잘 읽어갔는데 왜 그런 걸까요?
-
해결됨RAG를 활용한 LLM Application 개발 (feat. LangChain)
langsmith 사용하지 않고 개발 가능한가요?
안녕하세요현재 유료 결제나 외부로 API를 연동하는 것이 사내 보안 규정 상 어려운 상황입니다.강의에 나온 대로 langchain-core 라이브러리를 활용하는 경우 core 내부에 langsmith를 쓰는 import 가 있어 langsmith를 반드시 사용 해야하는 상황입니다. langsmith가 유료로 변경되면 API 키가 필요한 상황이라 현재 사내에서는 사용이 어려울 것 같습니다.이런 경우 langsmith를 사용하지 않고 유사하게 기능을 구현하는 방법이 있는지 궁금합니다.
-
미해결RAG를 활용한 LLM Application 개발 (feat. LangChain)
3.6 질문
624만원이 안나와요 ㅠ
-
해결됨RAG를 활용한 LLM Application 개발 (feat. LangChain)
3.4.1 PineconeVectorStore.from_documents() 안됩니다.
Upstage를 사용해도, exceeded 되었다고 에러나서요. 뭔가 최근에 토큰 제한이 줄었나봐요. 아래와 같이 batch를 주어서 반복문으로 요청후 database.add_documents(batch)하는 방식으로 해야되네요 ㅠㅠ from langchain_pinecone import PineconeVectorStore # 데이터를 처음 저장할 때 index_name = 'tax-upstage-index' # Split documents into smaller chunks text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=100) chunked_documents = text_splitter.split_documents(document_list) print(f"Chunked documents length: {len(chunked_documents)}") # Initialize the PineconeVectorStore database = PineconeVectorStore.from_documents( documents=[], # Start with an empty list embedding=embedding, index_name=index_name ) # Upload documents in batches batch_size = 100 for i in range(0, len(chunked_documents), batch_size): print(f'index: {i}, batch size: {batch_size}') batch = chunked_documents[i:i + batch_size] database.add_documents(batch) # Add documents to the existing database
-
미해결RAG를 활용한 LLM Application 개발 (feat. LangChain)
3.4강 Pinecone API 인식 못 하는 문제
안녕하세요, 강의들으면서 도움 많이 받고 있습니다.Pinecone API를 .env에 적었지만 인식을 못해서하기와 같이 직접적으로 입력해주었습니다.그런데 하기 부분에서 또 다시 정의가 안 되었다고 에러가 뜹니다.어디를 수정해야할까요?커널?을 껐다켰다하면 되는 분도 있다고 해서 따라해봤는데 잘 안 되는 것 같습니다.ㅠ
-
미해결RAG를 활용한 LLM Application 개발 (feat. LangChain)
3.2 RAG구성_400 에러 문의드립니다.
안녕하세요, 3.2 RAG구성 강의 중 하기 부분에서 막혔습니다. 조언 요청드립니다. OpenAI 대신, Upstage를 쓰고 싶어하기와 같이 코드 수정을 하였습니다.그런데 두번째 캡쳐 그림 부터 에러가 발생합니다.Upstage가 유효하지 않다고 하는 것 같은데...무엇이 잘못된 것 일까요? 그리고 실습을 위해 OpenAI를 결제해야한다면 얼마정도 하면, 완강하는데 문제없을까요?! Error code: 400 - {'error': {'message': 'The requested model is invalid or no longer supported. You can find the list of available models on our models page (https://console.upstage.ai/docs/models)', 'type': 'invalid_request_error', 'param': '', 'code': 'invalid_request_body'}}
-
미해결RAG를 활용한 LLM Application 개발 (feat. LangChain)
3.1 pyenv 설치관련
안녕하세요, 비개발자로서 하나씩 따라하려고 수강중에 있습니다.MAC이 아닌 PC인데 pyenv 말고 venv? 로 파이썬 가상환경 만들어도 되는 것인가요?
-
미해결RAG를 활용한 LLM Application 개발 (feat. LangChain)
답변 정확성이 떨어지는 것 같습니다
Upstage의 모델을 사용하는데 답변의 정확성이 떨어지는 것 같습니다. 아래 캡처 화면을 보면 retriever가 페이지를 가져오는 것 까지는 괜찮아 보이는데, 가져온 문서의 내용을 적용하여 계산하는 것, 그리고 심지어 기본적인 수학적 계산도 종종 오류를 냅니다 ㅜㅜ 더 정확한 답변을 내도록 할 방법이 있을까요?
-
해결됨RAG를 활용한 LLM Application 개발 (feat. LangChain)
배포시 버전 에러가 생깁니다
streamlit에서 배포시 위와 같은 에러가 발생합니다 ㅜㅜ파이썬 버전은 3.10.2이고, requirements.txt는 아래와 같습니다. aiohappyeyeballs==2.6.1aiohttp==3.10.11aiosignal==1.3.2altair==5.5.0annotated-types==0.6.0anyio==4.3.0asgiref==3.8.1asttokens==3.0.0async-timeout==4.0.3attrs==25.3.0backoff==2.2.1bcrypt==4.3.0blinker==1.9.0build==1.2.2.post1cachetools==5.5.2certifi==2022.12.7charset-normalizer==3.1.0chroma-hnswlib==0.7.6chromadb==0.6.3click==8.1.8colorama==0.4.6coloredlogs==15.0.1comm==0.2.2contourpy==1.2.0cycler==0.12.1dataclasses-json==0.6.7debugpy==1.8.14decorator==5.2.1Deprecated==1.2.18distro==1.9.0docx2txt==0.9durationpy==0.9exceptiongroup==1.2.0executing==2.2.0fastapi==0.115.12filelock==3.18.0flatbuffers==25.2.10fonttools==4.47.2frozenlist==1.6.0fsspec==2025.3.2gitdb==4.0.12GitPython==3.1.44google-auth==2.39.0googleapis-common-protos==1.70.0greenlet==3.2.2grpcio==1.71.0h11==0.14.0httpcore==1.0.4httptools==0.6.4httpx==0.27.0httpx-sse==0.4.0huggingface-hub==0.30.2humanfriendly==10.0idna==3.4importlib_metadata==8.6.1importlib_resources==6.5.2iniconfig==2.1.0ipykernel==6.29.5ipython==8.36.0jedi==0.19.2Jinja2==3.1.6jiter==0.9.0joblib==1.4.2jsonpatch==1.33jsonpointer==3.0.0jsonschema==4.23.0jsonschema-specifications==2025.4.1jupyter_client==8.6.3jupyter_core==5.7.2kiwisolver==1.4.5kubernetes==32.0.1langchain==0.3.25langchain-chroma==0.2.3langchain-community==0.3.23langchain-core==0.3.58langchain-openai==0.3.16langchain-pinecone==0.2.6langchain-tests==0.3.19langchain-text-splitters==0.3.8langchain-upstage==0.6.0langsmith==0.3.42markdown-it-py==3.0.0MarkupSafe==3.0.2marshmallow==3.26.1matplotlib==3.8.2matplotlib-inline==0.1.7mdurl==0.1.2mmh3==5.1.0mpmath==1.3.0multidict==6.4.3mypy_extensions==1.1.0narwhals==1.38.2nest-asyncio==1.6.0numpy==1.26.4oauthlib==3.2.2onnxruntime==1.21.1openai==1.78.0opentelemetry-api==1.32.1opentelemetry-exporter-otlp-proto-common==1.32.1opentelemetry-exporter-otlp-proto-grpc==1.32.1opentelemetry-instrumentation==0.53b1opentelemetry-instrumentation-asgi==0.53b1opentelemetry-instrumentation-fastapi==0.53b1opentelemetry-proto==1.32.1opentelemetry-sdk==1.32.1opentelemetry-semantic-conventions==0.53b1opentelemetry-util-http==0.53b1orjson==3.10.18overrides==7.7.0packaging==23.2pandas==2.2.3parso==0.8.4pillow==10.2.0pinecone==6.0.2pinecone-plugin-interface==0.0.7platformdirs==4.3.8pluggy==1.5.0posthog==4.0.1prompt_toolkit==3.0.51propcache==0.3.1protobuf==5.29.4psutil==7.0.0pure_eval==0.2.3pyarrow==20.0.0pyasn1==0.6.1pyasn1_modules==0.4.2pydantic==2.11.4pydantic-settings==2.9.1pydantic_core==2.33.2pydeck==0.9.1Pygments==2.19.1pyparsing==3.1.1pypdf==4.3.1PyPika==0.48.9pyproject_hooks==1.2.0pyreadline3==3.5.4pytest==8.3.5pytest-asyncio==0.26.0pytest-socket==0.7.0python-dateutil==2.8.2python-dotenv==1.1.0pytz==2025.2pywin32==305PyYAML==6.0.2pyzmq==26.4.0referencing==0.36.2regex==2024.11.6requests==2.32.3requests-oauthlib==2.0.0requests-toolbelt==1.0.0rich==14.0.0rpds-py==0.24.0rsa==4.9.1scikit-learn==1.5.1scipy==1.14.0shellingham==1.5.4six==1.16.0smmap==5.0.2sniffio==1.3.1SQLAlchemy==2.0.40stack-data==0.6.3starlette==0.46.2streamlit==1.45.0sympy==1.14.0syrupy==4.9.1tenacity==9.1.2threadpoolctl==3.5.0tiktoken==0.9.0tokenizers==0.19.1toml==0.10.2tomli==2.2.1tornado==6.4.2tqdm==4.66.2traitlets==5.14.3typer==0.15.3typing-inspect==0.9.0typing-inspection==0.4.0typing_extensions==4.13.2tzdata==2025.2urllib3==1.26.15uvicorn==0.34.2watchdog==6.0.0watchfiles==1.0.5wcwidth==0.2.13websocket-client==1.8.0websockets==15.0.1wrapt==1.17.2yarl==1.20.0zipp==3.21.0zstandard==0.23.0
-
해결됨RAG를 활용한 LLM Application 개발 (feat. LangChain)
langChain 최신버전 문서
최신 버전 LangChain 문서의 <How to add chat history> 부분이 강의 영상이랑 대부분 다른 것 같은데 강의 영상 코드 기준으로 진행해도 문제가 없을까요?(https://python.langchain.com/docs/how_to/qa_chat_history_how_to/#chains)
-
미해결RAG를 활용한 LLM Application 개발 (feat. LangChain)
배포 시 오류 (Chroma sqlite3 버전 오류)
안녕하세요 강사님.마지막 Streamlit Cloud 배포 후 버전 오류가 발생해서 질문 납깁니다!Python은 3.10.17 버전 사용하고 있습니다.retriever에 pinecone 사용하지 않고 Chroma 를 사용했고요, requirements.txt 에 버전은 langchain-chroma==0.2.3chromadb==0.6.3로 들어가 있습니다.오류는 unsupported version of sqlite3. Chroma requires sqlite3 >= 3.35.0.라고 뜨는 걸 보면 chromadb 에서 sqlite3 를 사용하고 그 버전 오류인 것 같은데요.. 어떻게 조치를 할지 검색해도 잘 모르겠어서 질문 남깁니다. 감사합니다.
-
미해결RAG를 활용한 LLM Application 개발 (feat. LangChain)
3.2.1 Upstage 로 embedding 하실때에 typeError..
3.2.1 OpenAIEmbeddings 대신 UpstageEmbeddings를 활용하는 방법 으로 실습 예제 하고 있는데요기존 예제로 하면 chain_type 이 없이 동영상자료에서는 그대로 실행되었는데, 실제로 해보니 chain_type 이 2번째로 와야 하는데 없어서 오류가 뜨더라구요,...아래는 동영상에서 실행되는 코드 입니다.from langchain.chains import RetrievalQA qa_chain = RetrievalQA.from_chain_type( llm, retriever=database.as_retriever(), chain_type_kwargs={"prompt": prompt} ) TypeError Traceback (most recent call last) Cell In[17], line 3 1 from langchain.chains import RetrievalQA ----> 3 qa_chain = RetrievalQA.from_chain_type( 4 llm, 5 database.as_retriever(), 6 chain_type_kwargs={"prompt":prompt} 7 )가 뜨게 되는데 확인해 보니, from langchain.chains import RetrievalQA qa_chain = RetrievalQA.from_chain_type( llm=llm, chain_type="stuff", # 기본 체인 타입 (원하면 "map_reduce"도 가능) retriever=database.as_retriever(), chain_type_kwargs={"prompt": prompt} ) chain_type 이 빠져서 안돌아 가더라구요..chain_type 을 넣어주면 잘 돌아갑니다. 혹시나 저처럼 헤메이실 분을 위해 올려둡니다. OpenAI 유료결제 안하는 바람에 Upstage로 따라해보려고 하는데...앞으로의 강의는 OpenAI 로 작성되는것 같아서 유료결제를 해야 할까요...??그리고 로컬 Ollama 로 하는 영상도 시간 나시면 올려주시면 좋겠어요~^^덕분에 langChain 의 l 도 모르던 제가 따라하게 되네요 좋은 영상 감사합니다.
-
미해결RAG를 활용한 LLM Application 개발 (feat. LangChain)
rag 데이터 가져오는 부분에서 질문드립니다!
안녕하세요 강사님정해져있는 문서를 Rag로 가져오는것이 아닌openAPI에서 필요한 정보를 호출해서 가져오도록 만들고 싶습니다.openAPI에 requests로 호출해서 데이터를 가져오는 부분까지 완성했습니다.수업중에 llm에게 dictionary 지정해주는것처럼openAPI에서 호출한 정보를 rag로 가져오도록 하는 방법을 가르쳐주세요감사합니다
-
미해결RAG를 활용한 LLM Application 개발 (feat. LangChain)
선생님 질문 있습니다 한번 봐주세여~!
안녕하세요 선생님 수업 잘 듣고 열심히 만들고 있는데 한가지 해결이 안되는 부분이 있어 이렇게 글 남깁니다.문서를 100개를 넣고, LLM이 대답할 때 인사규정에 따르면 혹은 인사규정을 참조하여 규정명을 나오게 하고 싶은데, 매칭이 잘안되거나 잘못된 규정명을 알려주곤 하는데 정확한 방법이 있을까요? 백터 DB에서 메타 데이터 지정하는 방식 이거나 document에 정의해 호출하는 방식 등을 사용하는데 .. 선생님도 이렇게 하실까요??
-
미해결RAG를 활용한 LLM Application 개발 (feat. LangChain)
embedding 과정 중 Error, message length too large 발생
안녕하십니까 강의 잘 듣고있습니다.!from langchain_ollama import OllamaEmbeddings embeddings = OllamaEmbeddings(model="llama3.2") import os from pinecone import Pinecone from langchain_pinecone import PineconeVectorStore index_name = "tax-table-index" pinecone_api_key = os.environ.get("PINECONE_API_KEY") pc = Pinecone(api_key=pinecone_api_key) database = PineconeVectorStore.from_documents(document_list, embedding=embeddings, index_name=index_name) Embedding 후 PinecondVectorStore 저장 할떄아래와 같은 예외가 발생합니다.```PineconeApiException: (400) Reason: Bad Request HTTP response headers: HTTPHeaderDict({'Date': 'Thu, 17 Apr 2025 02:53:26 GMT', 'Content-Type': 'application/json', 'Content-Length': '118', 'Connection': 'keep-alive', 'x-pinecone-request-latency-ms': '2664', 'x-pinecone-request-id': '9090329298438964680', 'x-envoy-upstream-service-time': '2', 'server': 'envoy'}) HTTP response body: {"code":11,"message":"Error, message length too large: found 4194738 bytes, the limit is: 4194304 bytes","details":[]} Output is truncated. View as a scrollable element or open in a text editor.```OllamaEmbeddings(model="llama3.2") 를 사용하고 있는데요.해당 모델로 임베딩을 하면 Pinecone에서 허용하는 데이터를 초과하는 것 으로 보이는데요이러한 경우 처리하는 방법이 있을까요?아니면 모델을 변경해야하는 걸까요?
-
해결됨RAG를 활용한 LLM Application 개발 (feat. LangChain)
맞는 답변은 5,000만원 이하에 대한 내용이어야 할것 같아요
올려주신 영상에서 LLM 답변이 5,000만원 초과 8,800만원 이하 구간에 대한 내용으로 나왔는데요, 1,400만원 초과 5,000만원 이하 구간에 대한 내용이 나와야 맞는 것 같아요 UpstageEmbeddings 사용하니까 이 구간에 대한 정보로 알려주네요
-
해결됨RAG를 활용한 LLM Application 개발 (feat. LangChain)
langchain 홈페이지 관련이요
강의중에 들어가시는 langchain 홈페이지가 지금이랑 version이 다른것 같은데 현재 version 홈페이지에서는 강의 내용에 나오는 곳을 찾을 수가 없습니다. 혹시 version이 달라도 괜찮을까요? 예를 들어 Microsoft Word Document loaders를 찾고 싶습니다.
-
해결됨RAG를 활용한 LLM Application 개발 (feat. LangChain)
No module named 'langchain_chroma' 발생해요
langchain_chroma를 다운로드하면 제대로 설치가 안되는것 같은데 무슨 문제가 있는걸까요?