markdown 스플리터에서 에러발생
from langchain_community.document_loaders import UnstructuredMarkdownLoader
markdown_path = "./documents/income_tax.md"
loader = UnstructuredMarkdownLoader(markdown_path)
document_list = loader.load_and_split(text_splitter)위 코드를 주피터에서 실행하였는데
아래와 같은 nltk 에러가 나옵니다....
[nltk_data] Error loading averaged_perceptron_tagger_eng: <urlopen [nltk_data] error [SSL: CERTIFICATE_VERIFY_FAILED] certificate [nltk_data] verify failed: unable to get local issuer certificate [nltk_data] (_ssl.c:1028)> [nltk_data] Error loading punkt_tab: <urlopen error [SSL: [nltk_data] CERTIFICATE_VERIFY_FAILED] certificate verify failed: [nltk_data] unable to get local issuer certificate (_ssl.c:1028)>
몇번을 시도해봐도 같은 에러가 발생하는데 어떻게 해결해야하나요
답변 1
0
안녕하세요! 왠지 unstructured package에서 발생하는 에러인 것 같은데, 야매긴 하지만 아래 방식을 한번 시도해보시겠어요?
import ssl
import nltk
# Disable SSL verification
ssl._create_default_https_context = ssl._create_unverified_context
from langchain_community.document_loaders import UnstructuredMarkdownLoader
markdown_path = "./documents/income_tax.md"
loader = UnstructuredMarkdownLoader(markdown_path)
document_list = loader.load_and_split(text_splitter)
max token을 제한하는게 왜 성능을 개선하게 되는걸까요?
0
31
2
pyzerox 유니코드 에러
0
74
2
영상 메타데이터 생성 관련 LLM 활용 질문
0
67
1
종합부동산세 부분 tool 사용 질문 드립니다.
0
74
2
uv sync 파이썬 버전문제 onnxruntime
-1
100
2
MCP를 활용해서 간단한 에이전트를 만들어보세요
0
96
1
PDF 형식
0
64
1
5.3 langchain-mcp-adpater를 활용한 MCP 도구 사용 tool_list 지연 사유
0
91
2
3.6 human_in_the_loop 3rd case
0
81
1
summary 를. 시스템메세지에 추가하는 부분에 관하여
0
69
3
병렬 처리 중 retrieve 관련 궁금한 사항
0
76
1
query 에 대한 answer 결과값이 나오지 않습니다.
0
94
2
사람과 관련된 표현이 없는데 rewrite 로 이동하지 않는경우
0
75
1
retriever 관련 질문
0
65
1
인터룹 관련 질문
0
49
2
2.4 Self-RAG 결과가 달라요!
0
77
2
md vs txt 차이..
0
134
2
OpenAI API 호출 때문에 발생하는 Error code: 429 문제
0
112
2
단순 도구 사용과 도구를 가진 에이전트를 사용하는 것의 차이가 궁금합니다.
0
88
1
LangChain과 LangGraph v1
0
136
1
2.4 강의 관련 질문(답변을 검증하는 self rag)
0
73
2
후속강의 문의
0
73
2
3.6 강의 관련 질문(interrupt 관련)
0
50
1
그래프 구현 조언 부탁드립니다!
0
76
2





