현존 최강 크롤링 기술: Scrapy와 Selenium 정복

selenium 문의

2021-11-01T14:08:50.289Z

344

toaehddn

작성한 질문수 29

안녕하세요, 강사님.

selenium 사용법에서 find_element(s)_by_~~ 가 있다고 배웠습니다.

그 앞단계에서 driver.get(url) 까지는 진행이 되어 있을것이고요...

그러면 이 driver.get(url)을 한 결과는, 

마치 requests.get(url)을 가지고 BeautifulSoup(requests.get(url).content, 'html.parser')를 통해 html에 대한 parsing 을 진행한 결과와 동일하다고 생각하면 되나요? 거기서도 이제 이어서 .find or .select 등을 사용해서 유사해 보여서 문의드립니다.

(참고로 본 강의 전에, 강사님의 '파이썬입문과 크롤링기초 부트캠프' 부터 듣고 와서, 자연스럽게 연결이 되어서 문의드립니다.)

그리고 이어서 텍스트를 뽑아낼때...

soup에서 .find or .select 한것은 .get_text() 로 뽑아내고,

driver.get(url)에서 .find_element(s)_by_~~은 html이 head이면 .get_attribute('text'), body이면 .text 뽑아낸다고 보면되나요?

selenium scrapy 웹-크롤링

답변 1

잔재미코딩 DaveLee

2021-11-03T02:32:22.255Z

안녕하세요.

말씀하신 사항은 전부 맞습니다. 유사한 기능이 selenium 에도 있는 것이니까요. 원리는 거의 비슷한 것인데, 동적 HTML 에서 뽑느냐, 정적 HTML 에서 뽑느냐의 차이가 크죠~

코딩을 잘 따라 한 것 같은데 오류가 발생하는 것 같습니다

2021-11-13T18:20:22.549Z

658

scrapy를 jupyter 환경에서 할 수 있나요

2021-11-12T03:23:11.926Z

378

[실전 크롤링: scrapy 크롤링 팁] 질문있습니다.

2021-11-11T15:03:34.100Z

333

[실전 크롤링: 지마켓 크롤링하며, scrapy 실전 활용법 익히기1] 5분50초쯤 질문

2021-11-10T12:44:57.016Z

241

[강력/최신 크롤링 기술: Scrapy 로 지마켓 크롤링하기1] 관련 질문

2021-11-10T08:05:49.979Z

291

xml을 parsing할때 <을 < 로 인식합니다.

2021-11-08T03:36:13.732Z

346

pipelines.py에서 process_item내에서 print문이 작동을 하지 않네요 ㅠ

2021-11-05T13:39:52.744Z

309

PhantomJS 문의

2021-11-01T23:52:44.989Z

312

브라우저 제어해서 크롤링하기 - 처음강의 마지막부분 문의

2021-10-29T10:44:05.304Z

3022

on error 해결 방법 질문

2021-10-12T09:14:10.840Z

371

[팁] 윈도우 cmd 커맨드

2021-10-06T02:49:01.140Z

358

[팁]Chrome User Agent 아는법

2021-09-27T03:57:05.947Z

344

실전 크롤링: 브라우저를 제어해서 트위터 사이트 로그인 하기 질문

2021-09-15T07:07:46.178Z

262

동영상 강의 만드실 때 사용한 툴을 알려주실 수 있을까요?

2021-08-09T04:26:17.102Z

261

CSS Selector 에서 질문이 있습니다.

2021-08-03T14:40:15.885Z

451

pip install scrapy 오류

2021-08-01T14:15:12.512Z

505

셀레니움 실행불가

2021-07-11T08:09:18.942Z

1599

실전 크롤링: XPATH와 Selenium 활용해서 페이스북 로그인 하기 에서 질문이 있습니다.

2021-07-10T08:22:00.028Z

242

언제 get_text()를 사용하고 또 언제 .text를 사용하나요?

2021-07-08T06:30:14.354Z

310

강의교안자료 받을수있을까요?

2021-06-29T13:00:39.047Z

275

[강의 9:27관련 질문] price, title 열 위치

2021-06-23T15:08:49.611Z

169

div에 있는 클래스가 2개이면 어떻게 하나요?

2021-06-21T12:09:28.145Z

378

css 셀렉터에 대해 질문이 있습니다.

2021-06-21T06:10:22.350Z

163

계쏙 질문해서 죄송합니다...

2021-06-03T13:38:22.720Z

237