CSS selector 사용해서 그롤링하기(2020 업데이트) 관련 질문입니다.

Question

안녕하세요, 선생님.

어렵지만..잘 설명해주시는 덕분에 강의 잘 듣고 있습니다 :)

다름 아니라 CSS selector 사용해서 그롤링하기(2020 업데이트) 에 올려주신 자료에 질문이 있습니다.

13페이지에서 다음 경제란에서 경제 주요 뉴스 타이틀 가져오기를 해보는데 결과 값이 나오지 않습니다.

제가 작성한 코드는 아래와 같습니다.

import requests

from bs4 import BeautifulSoup

res = requests.get('https://news.daum.net/economic/')

soup = BeautifulSoup(res.content, 'html.parser')

data = soup.select('#mArticle > div > ul > li > strong > a')

for i in data :

print(i.get_text())

바쁘시겠지만 확인 한 번 부탁드리겠습니다!

감사합니다 :)

Answer

안녕하세요. 우선 답변 감사합니다.

해당 파일은 10/12에 강의 들으면서 다운 받았었는데 변겨됐다니 저도 참 이상하네요 ㅎㅎㅎㅎ

혹시 몰라 해당 파일 첨부하여 드리고 싶은데 첨부 기능을 찾기가 어렵네요.

말씀해주신 코드는 실행하여보겠습니다.

다시 한 번 확인 감사합니다!

Answer

안녕하세요.

해당 챕터에 업로드되어 있는 파일은 crawling_basic8.pdf 인데요. 혹시 예전에 다운로드받으신 자료인 것이 아닐까 생각이 들어서요. 해당 자료를 어제도 확인해봤었는데, 말씀하신 코드가 없습니다. 이미 그 전에, 코드 자체는 사이트 변경으로 동작을 하지 않기 때문에, 코드 자체를 넣어놓지 않았습니다. 새로 다운로드 받으시면, 관련 코드는 없는 것을 확인하실 수 있으실꺼예요~~

또 자료의 기술된 부분이 어떤 데이터를 크롤링하는지 모르겠으나, 간단히 다음과 같이만 해도 주요 뉴스 타이틀정도는 가져올 수 있습니다. 감사합니다.

import requests

from bs4 import BeautifulSoup

res = requests.get('https://news.daum.net/economic/')

soup = BeautifulSoup(res.content, 'html.parser')

data = soup.select('ul.list_mainnews > li > div.cont_thumb > strong')

for i in data :

print(i.get_text())

Answer

안녕하세요.

질문드린 내용은 말씀해주신 것처럼 강의에는 나오지 않고 강의 자료에만 나온 내용입니다.

'CSS selector 사용해서 크롤링하기(2020 업데이트)1, 2'에 올라와 있는 pdf 강의자료 13페이지에 있는 것입니다.

감사합니다.

Answer

안녕하세요.

연관 강의와 연결되어 있지도 않고, 강의 시간도 나와있지 않아서, 한참을 찾아봤는데요. 관련 영상은 없는 것 같기도 해서요. 혹시 이 챕터에서, 몇분 정도에 이 내용을 설명하는지 좀 알 수 있을까요?

감사합니다.

김아람

CSS selector 사용해서 그롤링하기(2020 업데이트) 관련 질문입니다.

이 글과 비슷한 Q&A

실행을 했음에도 연결이 안되는 경우는 어떻게 해야할까요

Robustscaler 질문

미로탐색 상태트리

04-04 강의에서 질문 있습니다