쉽게 처음하는 파이썬 고급 크롤링 [Scrapy, Selenium, Headless Chrome]

연습문제로 풀어보기3 : 동적 웹사이트 크롤링과 활용

css_selector 질

2022-02-02T04:26:43.877Z

236

허쿡

작성한 질문수 51

안녕하세요. 강의 잘 듣고 있습니다 :)

17강(연습문제로 풀어보기3 : 동적 웹사이트 크롤링과 활용)

1분49초 부분

개발자모드로(F12) 로 보면

<span class=news > 뉴스: 머신러닝 강좌가 나왔어요~~

로 나와있어서

elem = driver.find_element_by_css_selector("span.news")

로 코딩 후 run해 봤는데 데이터가 안 뜹니다. js로 html을 구현하는 방식으로 인해 위 코드가 먹히지 않는걸까요?

js파일에서 news로 해당 데이터를 포함시켜서 위와 같이

span 태그를 포함시키는 경우 데이터 추출이 안되는 건가 싶어서 여쭤봅니다.

감사합니다.

scrapy 웹-크롤링 selenium bigdata

답변 1

잔재미코딩 DaveLee

2022-02-03T09:55:28.652Z

왠지 강의에서 설명을 드린 듯한데요...

해당 부분은 웹페이지가 만들어진 후에, 더 업데이트되어 보여지는 부분이라서, 웹브라우저가 뜬 후, 일정 시간 기다린 후에, 크롤링을 해야 합니다. 이 부분 강의에서 어떻게 기다리는지까지 말씀드린 것 같아요. 다시 한번 관련 영상을 봐보시면서 이해해보시면 어떠실까요?

허쿡

2022-02-04T01:37:59.065Z

강의에서 설명 주셨지만 좀 더 자세히 여쭤보고 싶었습니다.

답변 감사합니다~!

[REST API] data의 교환방식 질문

2023-04-13T13:55:08.590Z

688

headless chrome 오류 문의

2023-02-11T15:58:38.228Z

1505

Selenium 처리 속도 관련 문의드립니다.

2023-01-28T06:40:09.301Z

1973

동적 웹사이트에서 element가 선택되지 않는 문제에 관해 질문드립니다

2022-12-23T08:30:29.046Z

705

webdriver manager

2022-12-08T18:43:40.754Z

462

__init__() got an unexpected keyword argument 'service' 에러 질문드립니다.

2022-08-16T15:52:08.241Z

11734

Jupiter NoteBook 파일과 PDF 파일은 어디서 다운로드 받을 수 있나요?

2022-08-03T13:14:49.341Z

481

scrapy option질문

2022-07-30T12:02:32.905Z

255

response.css 질문드립니다.

2022-07-27T18:58:43.530Z

384

scrapy 크롤링 수행시 ffi.callback() 에러가 발생합니다

2022-07-05T23:13:01.121Z

415

selenium으로 여러페이지 수집시 질문

2022-07-01T04:41:51.553Z

398

연습6 모범 코드: 로그인 시나리오 해보기

2022-06-30T17:14:36.497Z

290

셀레니움 문법 업그레이드 , find_element_by_tag_name 오류

2022-06-29T19:31:56.695Z

2851

셀레니움 버전 변경으로 인한 코드 변경

2022-06-29T14:38:40.512Z

1298

headless error

2022-06-29T13:23:55.859Z

458

질문있습니다!

2022-06-29T01:45:03.896Z

485

안녕하세요 선생님! 질문있습니다.

2022-06-25T13:56:25.953Z

249

selenium&scrapy문의

2022-06-12T08:55:46.477Z

298

아래분(phantele47)과 동일한 문제가 발생해서 문의드립니다.

2022-06-12T07:42:40.964Z

948

ip 차단을 피하려면 어떻게 해야 하나요?

2022-06-08T08:38:08.595Z

3431

start_urls = ['']가 제공해주신 것과 다르게 작동합니다.

2022-05-30T07:59:43.670Z

305

json, data = json.loads(response.body_as_unicode()) 부분에 문제가 있는 것 같습니다.

2022-05-26T07:59:26.698Z

622

웹크롤링이 상대방 서버에 부담이 될 때는 어떻게 하나요~?

2022-04-13T16:57:48.700Z

703

scrapy 윈도우버전의 설명은 따로 없나요??

2022-04-13T16:20:25.535Z

342