inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[리뉴얼] 파이썬입문과 크롤링기초 부트캠프 [파이썬, 웹, 데이터 이해 기본까지] (업데이트)

CSS selector 사용해서 그롤링하기(2020 업데이트) 관련 질문입니다.

357

김아람

작성한 질문수 6

0

안녕하세요, 선생님. 

어렵지만..잘 설명해주시는 덕분에 강의 잘 듣고 있습니다 :)

다름 아니라 CSS selector 사용해서 그롤링하기(2020 업데이트) 에 올려주신 자료에 질문이 있습니다.

13페이지에서 다음 경제란에서 경제 주요 뉴스 타이틀 가져오기를 해보는데 결과 값이 나오지 않습니다.

제가 작성한 코드는 아래와 같습니다.

import requests

from bs4 import BeautifulSoup

res = requests.get('https://news.daum.net/economic/')

soup = BeautifulSoup(res.content, 'html.parser')

data = soup.select('#mArticle > div > ul > li > strong > a')

for i in data :

    print(i.get_text())

바쁘시겠지만 확인 한 번 부탁드리겠습니다!

감사합니다 :)

웹-크롤링 python

답변 4

0

김아람

안녕하세요. 우선 답변 감사합니다.

해당 파일은 10/12에 강의 들으면서 다운 받았었는데 변겨됐다니 저도 참 이상하네요 ㅎㅎㅎㅎ

혹시 몰라 해당 파일 첨부하여 드리고 싶은데 첨부 기능을 찾기가 어렵네요.

말씀해주신 코드는 실행하여보겠습니다.

다시 한 번 확인 감사합니다!

0

잔재미코딩 DaveLee

안녕하세요. 

해당 챕터에 업로드되어 있는 파일은 crawling_basic8.pdf 인데요. 혹시 예전에 다운로드받으신 자료인 것이 아닐까 생각이 들어서요. 해당 자료를 어제도 확인해봤었는데, 말씀하신 코드가 없습니다. 이미 그 전에, 코드 자체는 사이트 변경으로 동작을 하지 않기 때문에, 코드 자체를 넣어놓지 않았습니다. 새로 다운로드 받으시면, 관련 코드는 없는 것을 확인하실 수 있으실꺼예요~~

또 자료의 기술된 부분이 어떤 데이터를 크롤링하는지 모르겠으나, 간단히 다음과 같이만 해도 주요 뉴스 타이틀정도는 가져올 수 있습니다. 감사합니다.

import requests

from bs4 import BeautifulSoup

res = requests.get('https://news.daum.net/economic/')

soup = BeautifulSoup(res.content, 'html.parser')

data = soup.select('ul.list_mainnews > li > div.cont_thumb > strong')

for i in data :

    print(i.get_text())

0

김아람

안녕하세요.

질문드린 내용은 말씀해주신 것처럼 강의에는 나오지 않고 강의 자료에만 나온 내용입니다.

'CSS selector 사용해서 크롤링하기(2020 업데이트)1, 2'에 올라와 있는 pdf 강의자료 13페이지에 있는 것입니다.

감사합니다.

0

잔재미코딩 DaveLee

안녕하세요. 

연관 강의와 연결되어 있지도 않고, 강의 시간도 나와있지 않아서, 한참을 찾아봤는데요. 관련 영상은 없는 것 같기도 해서요. 혹시 이 챕터에서, 몇분 정도에 이 내용을 설명하는지 좀 알 수 있을까요?

감사합니다.

크롤링, 영상을 따라해도 제미나에게 물어봐도 안되요

0

33

1

정규표현식 및 여러 코드 꼭 외워야 하나요?

0

39

1

리스트 함수형도 정수 데이터 받을 수 있나요?

0

45

1

크롤링 관련 질문

0

63

1

문제 답이 없는 버전은 없나요?

0

74

1

requests, BeautifulSoup 임포트 부분에 대해 문의드립니다.

0

83

1

업데이트 강의

0

97

2

선생님 강의중에서 sqlite3 강의를 제공한 강의가 있나요?

0

123

2

연습용 예제 파일

0

76

1

lxml 관련 오류

0

106

1

SAVE Request 창 띄우는 법

0

92

1

포스트맨 사용법이 바뀌어서 강의를 따라가지 못하겠습니다. 2

0

75

1

포스트맨 사용법이 바뀌어서 강의를 따라가지 못하겠습니다.

0

95

1

예제 2, 4, 6에 대한 풀이 방식 질문.

0

89

1

문제 파일

0

78

1

pdf 파일 내 코드 복붙시 공백

0

291

1

데이터 저장 강좌 문의 건

0

95

1

" " 와 ' '의 차이를 알고 싶습니다

0

242

1

Exercise 22. 문자열 다루기 (strip)

0

132

1

list함수로 리스트 선언하면 실패하는데 이유는 무엇입니까?

0

187

1

셀 삽입후 바로 기입이 가능합니까?

0

139

2

주피터 노트북 마우스 스크롤? 오류

0

1546

2

등호 2개('==')의 의미가 뭐죠?

0

459

2

페이지가 넘어갈 때 url 변하지 않는 경우

0

266

1