inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

쉽게 처음하는 파이썬 고급 크롤링 [Scrapy, Selenium, Headless Chrome]

연습문제로 풀어보기3 : 동적 웹사이트 크롤링과 활용

css_selector 질

233

허쿡

작성한 질문수 51

0

안녕하세요. 강의 잘 듣고 있습니다 :)

 

17강(연습문제로 풀어보기3 : 동적 웹사이트 크롤링과 활용)

1분49초 부분

 

개발자모드로(F12) 로 보면

<span class=news > 뉴스: 머신러닝 강좌가 나왔어요~~

로 나와있어서

 

elem = driver.find_element_by_css_selector("span.news")

로 코딩 후 run해 봤는데 데이터가 안 뜹니다. js로 html을 구현하는 방식으로 인해 위 코드가 먹히지 않는걸까요?

js파일에서 news로 해당 데이터를 포함시켜서 위와 같이

span 태그를 포함시키는 경우 데이터 추출이 안되는 건가  싶어서 여쭤봅니다.

 

감사합니다.

 

 

 

scrapy 웹-크롤링 selenium bigdata

답변 1

0

잔재미코딩 DaveLee

왠지 강의에서 설명을 드린 듯한데요...

해당 부분은 웹페이지가 만들어진 후에, 더 업데이트되어 보여지는 부분이라서, 웹브라우저가 뜬 후, 일정 시간 기다린 후에, 크롤링을 해야 합니다. 이 부분 강의에서 어떻게 기다리는지까지 말씀드린 것 같아요. 다시 한번 관련 영상을 봐보시면서 이해해보시면 어떠실까요?

0

허쿡

강의에서 설명 주셨지만 좀 더 자세히 여쭤보고 싶었습니다. 

답변 감사합니다~!

[REST API] data의 교환방식 질문

1

676

1

headless chrome 오류 문의

0

1495

1

Selenium 처리 속도 관련 문의드립니다.

0

1964

1

동적 웹사이트에서 element가 선택되지 않는 문제에 관해 질문드립니다

0

695

1

webdriver manager

0

451

1

__init__() got an unexpected keyword argument 'service' 에러 질문드립니다.

1

11722

1

Jupiter NoteBook 파일과 PDF 파일은 어디서 다운로드 받을 수 있나요?

0

451

1

scrapy option질문

1

247

1

response.css 질문드립니다.

0

377

1

scrapy 크롤링 수행시 ffi.callback() 에러가 발생합니다

0

403

1

selenium으로 여러페이지 수집시 질문

0

387

1

연습6 모범 코드: 로그인 시나리오 해보기

0

279

1

셀레니움 문법 업그레이드 , find_element_by_tag_name 오류

3

2840

1

셀레니움 버전 변경으로 인한 코드 변경

0

1289

1

headless error

0

447

1

질문있습니다!

0

467

1

안녕하세요 선생님! 질문있습니다.

0

236

1

selenium&scrapy문의

0

286

1

아래분(phantele47)과 동일한 문제가 발생해서 문의드립니다.

0

921

6

ip 차단을 피하려면 어떻게 해야 하나요?

0

3394

2

start_urls = ['']가 제공해주신 것과 다르게 작동합니다.

1

299

2

json, data = json.loads(response.body_as_unicode()) 부분에 문제가 있는 것 같습니다.

0

614

3

웹크롤링이 상대방 서버에 부담이 될 때는 어떻게 하나요~?

0

693

1

scrapy 윈도우버전의 설명은 따로 없나요??

0

335

1