파싱에서 BeautifulSoup질문
322
작성한 질문수 20
패턴으로 실습하며 익히기: 크롤링 코드 패턴으로 익히기2 10:19
3번 웹페이지 파싱하기에서 BeautifulSoup(res.content,"html.parser") 에서
질문이 있습니다
BeautifulSoup은 함수가 아니라 라이브러리인데
BeautifulSoup(인자1,인자2)형태인지
"html.parser"는 왜 따옴표를 붙여줘야하는지
BeautifulSoup( , )은 어떤 역할을 하는것인지
입니다
답변 1
0
안녕하세요. 답변 도우미입니다.
여기서 BeautifulSoup은 bs4라는 패키지 안에 정의된 클래스입니다. 클래스는 객체를 생성하는 '틀' 같은 것으로 이해하시면 됩니다. 따라서 BeautifulSoup(res.content, "html.parser")는 BeautifulSoup 클래스의 인스턴스(즉, 객체)를 생성하는 코드입니다.
BeautifulSoup(인자1, 인자2) 형태는 클래스의 생성자 함수를 호출하는 것입니다. 생성자 함수는 클래스를 기반으로 객체를 생성할 때 호출되며, 필요한 초기화 작업을 수행합니다.
여기서 res.content와 "html.parser"는 BeautifulSoup 생성자 함수에 전달되는 인자들입니다.
res.content는 웹페이지의 내용을 담고 있는 데이터입니다.requests라이브러리를 사용하여 웹페이지를 가져올 때, 웹페이지의 내용은Response객체의content속성에 저장됩니다."html.parser"는 BeautifulSoup가 사용할 파서(parser)의 이름입니다. 파서는 문서의 구조를 해석하는 역할을 합니다."html.parser"는 Python 표준 라이브러리에 포함된 HTML 파서를 사용하겠다는 의미입니다.
따라서, BeautifulSoup(res.content, "html.parser")는 웹페이지의 내용(res.content)을 HTML 파서("html.parser")를 사용하여 해석하는 BeautifulSoup 객체를 생성합니다. 이 객체는 이후에 웹페이지의 구조를 탐색하고 데이터를 추출하는 데 사용됩니다.
감사합니다.
65강 소리
0
19
1
섹션 5 CSS selector사용해서 클로링하기2의 커리큘럼 일정 부재?
0
19
2
크롤링, 영상을 따라해도 제미나에게 물어봐도 안되요
0
38
1
정규표현식 및 여러 코드 꼭 외워야 하나요?
0
44
1
리스트 함수형도 정수 데이터 받을 수 있나요?
0
50
1
크롤링 관련 질문
0
69
1
문제 답이 없는 버전은 없나요?
0
78
1
requests, BeautifulSoup 임포트 부분에 대해 문의드립니다.
0
87
1
업데이트 강의
0
103
2
선생님 강의중에서 sqlite3 강의를 제공한 강의가 있나요?
0
128
2
연습용 예제 파일
0
79
1
lxml 관련 오류
0
110
1
SAVE Request 창 띄우는 법
0
96
1
포스트맨 사용법이 바뀌어서 강의를 따라가지 못하겠습니다. 2
0
80
1
포스트맨 사용법이 바뀌어서 강의를 따라가지 못하겠습니다.
0
102
1
예제 2, 4, 6에 대한 풀이 방식 질문.
0
93
1
문제 파일
0
83
1
pdf 파일 내 코드 복붙시 공백
0
297
1
데이터 저장 강좌 문의 건
0
100
1
" " 와 ' '의 차이를 알고 싶습니다
0
246
1
Exercise 22. 문자열 다루기 (strip)
0
138
1
list함수로 리스트 선언하면 실패하는데 이유는 무엇입니까?
0
193
1
셀 삽입후 바로 기입이 가능합니까?
0
143
2
주피터 노트북 마우스 스크롤? 오류
0
1556
2





