css_selector 질
233
작성한 질문수 51
안녕하세요. 강의 잘 듣고 있습니다 :)
17강(연습문제로 풀어보기3 : 동적 웹사이트 크롤링과 활용)
1분49초 부분
개발자모드로(F12) 로 보면
<span class=news > 뉴스: 머신러닝 강좌가 나왔어요~~
로 나와있어서
elem = driver.find_element_by_css_selector("span.news")
로 코딩 후 run해 봤는데 데이터가 안 뜹니다. js로 html을 구현하는 방식으로 인해 위 코드가 먹히지 않는걸까요?
js파일에서 news로 해당 데이터를 포함시켜서 위와 같이
span 태그를 포함시키는 경우 데이터 추출이 안되는 건가 싶어서 여쭤봅니다.
감사합니다.
답변 1
0
왠지 강의에서 설명을 드린 듯한데요...
해당 부분은 웹페이지가 만들어진 후에, 더 업데이트되어 보여지는 부분이라서, 웹브라우저가 뜬 후, 일정 시간 기다린 후에, 크롤링을 해야 합니다. 이 부분 강의에서 어떻게 기다리는지까지 말씀드린 것 같아요. 다시 한번 관련 영상을 봐보시면서 이해해보시면 어떠실까요?
[REST API] data의 교환방식 질문
1
676
1
headless chrome 오류 문의
0
1495
1
Selenium 처리 속도 관련 문의드립니다.
0
1964
1
동적 웹사이트에서 element가 선택되지 않는 문제에 관해 질문드립니다
0
695
1
webdriver manager
0
451
1
__init__() got an unexpected keyword argument 'service' 에러 질문드립니다.
1
11722
1
Jupiter NoteBook 파일과 PDF 파일은 어디서 다운로드 받을 수 있나요?
0
451
1
scrapy option질문
1
247
1
response.css 질문드립니다.
0
377
1
scrapy 크롤링 수행시 ffi.callback() 에러가 발생합니다
0
403
1
selenium으로 여러페이지 수집시 질문
0
387
1
연습6 모범 코드: 로그인 시나리오 해보기
0
279
1
셀레니움 문법 업그레이드 , find_element_by_tag_name 오류
3
2840
1
셀레니움 버전 변경으로 인한 코드 변경
0
1289
1
headless error
0
447
1
질문있습니다!
0
467
1
안녕하세요 선생님! 질문있습니다.
0
236
1
selenium&scrapy문의
0
286
1
아래분(phantele47)과 동일한 문제가 발생해서 문의드립니다.
0
921
6
ip 차단을 피하려면 어떻게 해야 하나요?
0
3394
2
start_urls = ['']가 제공해주신 것과 다르게 작동합니다.
1
299
2
json, data = json.loads(response.body_as_unicode()) 부분에 문제가 있는 것 같습니다.
0
614
3
웹크롤링이 상대방 서버에 부담이 될 때는 어떻게 하나요~?
0
693
1
scrapy 윈도우버전의 설명은 따로 없나요??
0
335
1





