강의

멘토링

커뮤니티

Cộng đồng Hỏi & Đáp của Inflearn

Hình ảnh hồ sơ của godsibless2186
godsibless2186

câu hỏi đã được viết

Phát triển công việc tự động hóa bảo mật Python và ứng dụng OpenAI API vào công việc

Trích xuất thông tin văn bản mã độc bằng crawling

BeautifulSoup(html, "html5lib") 오류발생

Viết

·

208

0

2024년 10월 현재 제 pc에 설치된 버전은 requests 2.32.3, beautifulsoup 4.12.3, bs4 0.0.2 , python 3.1.3 인데,

soup = BeautifulSoup(html, "html5lib") 코드는 오류발생 합니다.

"html5lib"대신 "html.parser" 사용하면 정상 작동합니다.

soup = BeautifulSoup(html, "html.parser")

python웹-크롤링slackflask

Câu trả lời 1

0

안녕하세요, 인프런 AI 인턴입니다. godsibless님.

BeautifulSoup 모듈을 사용할 때 발생하는 오류에 대한 문제로 보입니다. 사용하신 html5lib 파서는 HTML 및 XML 을 파싱할 때 표준 HTML5 파싱 규칙을 따르지만, 시스템에 “html5lib” 라이브러리가 설치되어 있지 않거나 다른 호환성 문제가 있을 때 오류가 발생할 수 있습니다. 이 경우 html.parser 파서를 사용하면 기본 HTML 파서로써 작동하게 되어 정상 작동하는 것이 보편적입니다.

“html5lib” 대신 “html.parser”로 정상 작동하는 이유 요약:

  1. html.parser 기본 포함: Python의 기본 라이브러리인 “html.parser”는 추가 설치가 필요 없으며 범용적인 파서입니다.

  2. html5lib 설치 필요: “html5lib”를 사용하려면 해당 모듈을 별도로 설치해야 하며, 설치되지 않은 경우 오류가 발생할 수 있습니다.

  3. 라이브러리 호환성: 설치된 Python 버전과 완벽하게 호환되지 않을 경우 특정 파서에서 오류가 발생할 수 있습니다.

이러한 경우에는 html.parser를 사용하는 것이 일반적으로 문제를 해결하는 방법입니다. 다만, html5lib를 사용하고 싶다면, ‘html5lib’ 라이브러리가 올바르게 설치되어 있는지 확인해 보시기 바랍니다. 설치는 아래의 명령어를 통해 수행할 수 있습니다:

pip install html5lib

관련하여 동일한 문제를 겪고 계신 다른 학습자의 질문과 토론을 통해 추가적인 정보를 얻을 수 있습니다. 유사한 문제의 다른 사례들을 참고하시기 바랍니다:

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

Hình ảnh hồ sơ của godsibless2186
godsibless2186

câu hỏi đã được viết

Đặt câu hỏi