• 카테고리

    질문 & 답변
  • 세부 분야

    데이터 분석

  • 해결 여부

    미해결

CSS selector 사용해서 그롤링하기(2020 업데이트) 관련 질문입니다.

20.10.12 14:44 작성 조회수 223

0

안녕하세요, 선생님. 

어렵지만..잘 설명해주시는 덕분에 강의 잘 듣고 있습니다 :)

다름 아니라 CSS selector 사용해서 그롤링하기(2020 업데이트) 에 올려주신 자료에 질문이 있습니다.

13페이지에서 다음 경제란에서 경제 주요 뉴스 타이틀 가져오기를 해보는데 결과 값이 나오지 않습니다.

제가 작성한 코드는 아래와 같습니다.

import requests

from bs4 import BeautifulSoup

res = requests.get('https://news.daum.net/economic/')

soup = BeautifulSoup(res.content, 'html.parser')

data = soup.select('#mArticle > div > ul > li > strong > a')

for i in data :

    print(i.get_text())

바쁘시겠지만 확인 한 번 부탁드리겠습니다!

감사합니다 :)

답변 4

·

답변을 작성해보세요.

0

김아람님의 프로필

김아람

질문자

2020.10.14

안녕하세요. 우선 답변 감사합니다.

해당 파일은 10/12에 강의 들으면서 다운 받았었는데 변겨됐다니 저도 참 이상하네요 ㅎㅎㅎㅎ

혹시 몰라 해당 파일 첨부하여 드리고 싶은데 첨부 기능을 찾기가 어렵네요.

말씀해주신 코드는 실행하여보겠습니다.

다시 한 번 확인 감사합니다!

0

안녕하세요. 

해당 챕터에 업로드되어 있는 파일은 crawling_basic8.pdf 인데요. 혹시 예전에 다운로드받으신 자료인 것이 아닐까 생각이 들어서요. 해당 자료를 어제도 확인해봤었는데, 말씀하신 코드가 없습니다. 이미 그 전에, 코드 자체는 사이트 변경으로 동작을 하지 않기 때문에, 코드 자체를 넣어놓지 않았습니다. 새로 다운로드 받으시면, 관련 코드는 없는 것을 확인하실 수 있으실꺼예요~~

또 자료의 기술된 부분이 어떤 데이터를 크롤링하는지 모르겠으나, 간단히 다음과 같이만 해도 주요 뉴스 타이틀정도는 가져올 수 있습니다. 감사합니다.

import requests

from bs4 import BeautifulSoup

res = requests.get('https://news.daum.net/economic/')

soup = BeautifulSoup(res.content, 'html.parser')

data = soup.select('ul.list_mainnews > li > div.cont_thumb > strong')

for i in data :

    print(i.get_text())

0

김아람님의 프로필

김아람

질문자

2020.10.13

안녕하세요.

질문드린 내용은 말씀해주신 것처럼 강의에는 나오지 않고 강의 자료에만 나온 내용입니다.

'CSS selector 사용해서 크롤링하기(2020 업데이트)1, 2'에 올라와 있는 pdf 강의자료 13페이지에 있는 것입니다.

감사합니다.

0

안녕하세요. 

연관 강의와 연결되어 있지도 않고, 강의 시간도 나와있지 않아서, 한참을 찾아봤는데요. 관련 영상은 없는 것 같기도 해서요. 혹시 이 챕터에서, 몇분 정도에 이 내용을 설명하는지 좀 알 수 있을까요?

감사합니다.