강의

멘토링

커뮤니티

인프런 커뮤니티 질문&답변

toaehddn님의 프로필 이미지
toaehddn

작성한 질문수

현존 최강 크롤링 기술: Scrapy와 Selenium 정복

selenium 문의

작성

·

323

0

안녕하세요, 강사님.
 
selenium 사용법에서 find_element(s)_by_~~ 가 있다고 배웠습니다.
그 앞단계에서 driver.get(url) 까지는 진행이 되어 있을것이고요...
 
그러면 이 driver.get(url)을 한 결과는,
마치 requests.get(url)을 가지고 BeautifulSoup(requests.get(url).content, 'html.parser')를 통해 html에 대한 parsing 을 진행한 결과와 동일하다고 생각하면 되나요? 거기서도 이제 이어서 .find or .select 등을 사용해서 유사해 보여서 문의드립니다.
 
(참고로 본 강의 전에, 강사님의 '파이썬입문과 크롤링기초 부트캠프' 부터 듣고 와서, 자연스럽게 연결이 되어서 문의드립니다.)
 
그리고 이어서 텍스트를 뽑아낼때...
soup에서 .find or .select 한것은 .get_text() 로 뽑아내고,
driver.get(url)에서 .find_element(s)_by_~~은 html이 head이면 .get_attribute('text'), body이면 .text 뽑아낸다고 보면되나요?
 

답변 1

0

안녕하세요.

말씀하신 사항은 전부 맞습니다. 유사한 기능이 selenium 에도 있는 것이니까요. 원리는 거의 비슷한 것인데, 동적 HTML 에서 뽑느냐, 정적 HTML 에서 뽑느냐의 차이가 크죠~

toaehddn님의 프로필 이미지
toaehddn

작성한 질문수

질문하기