강의

멘토링

로드맵

Inflearn brand logo image

인프런 커뮤니티 질문&답변

cwk1412님의 프로필 이미지
cwk1412

작성한 질문수

LangGraph를 활용한 AI Agent 개발 (feat. MCP)

2.2 간단한 Retrieval 에이전트 (feat. PDF 전처리 꿀팁)

markdown 스플리터에서 에러발생

해결된 질문

작성

·

79

0

 

from langchain_community.document_loaders import UnstructuredMarkdownLoader

markdown_path = "./documents/income_tax.md"
loader = UnstructuredMarkdownLoader(markdown_path)
document_list = loader.load_and_split(text_splitter)

위 코드를 주피터에서 실행하였는데

 

아래와 같은 nltk 에러가 나옵니다....

[nltk_data] Error loading averaged_perceptron_tagger_eng: <urlopen [nltk_data] error [SSL: CERTIFICATE_VERIFY_FAILED] certificate [nltk_data] verify failed: unable to get local issuer certificate [nltk_data] (_ssl.c:1028)> [nltk_data] Error loading punkt_tab: <urlopen error [SSL: [nltk_data] CERTIFICATE_VERIFY_FAILED] certificate verify failed: [nltk_data] unable to get local issuer certificate (_ssl.c:1028)>

 

몇번을 시도해봐도 같은 에러가 발생하는데 어떻게 해결해야하나요

 

답변 1

0

강병진님의 프로필 이미지
강병진
지식공유자

안녕하세요! 왠지 unstructured package에서 발생하는 에러인 것 같은데, 야매긴 하지만 아래 방식을 한번 시도해보시겠어요?

 

import ssl
import nltk

# Disable SSL verification
ssl._create_default_https_context = ssl._create_unverified_context


from langchain_community.document_loaders import UnstructuredMarkdownLoader


markdown_path = "./documents/income_tax.md"
loader = UnstructuredMarkdownLoader(markdown_path)
document_list = loader.load_and_split(text_splitter)
cwk1412님의 프로필 이미지
cwk1412

작성한 질문수

질문하기