inflearn logo
강의

講義

知識共有

超簡易超スピードデータ収集(Pythonクロール)

urlリンクを見つけてクロールする

질문이요

247

Inhoo Song

投稿した質問数 5

2

import requests
from bs4 import BeautifulSoup
req = requests.get(
'https://www.donga.com/news/Entertainment/List?p=1&prod=news&ymd=&m=')
soup = BeautifulSoup(req.text
, 'html.parser')

for i in soup.select("#contents > div.page > a") :

req2 = requests.get(
"http://www.donga.com/news/List/Enter/" + i['href'])
soup2 = BeautifulSoup(req2.text
, 'html.parser')

for i in soup2.find_all("span", class_="tit") :
print(i.text)


C:\Users\karma\PycharmProjects\pychamwebcrawling\venv\Scripts\python.exe "C:/Users/karma/PycharmProjects/pychamwebcrawling/01_web_crawling_naver_test/url 링크 찾아내서 크롤링.py" Process finished with exit code 0

머가 문제인건가요???


웹-크롤링 python

回答 4

0

bokchi

파이팅입니다~

0

irunspal

감사합니다.

기초가부족한 상태라

기초를 잘 다져서 따라해보겠습니다

0

bokchi

코드를 약간 수정했습니다 여기서부터 한번 시작해보실래요?

0

bokchi

import requests
from bs4 import BeautifulSoup
req = requests.get('https://www.donga.com/news/Entertainment/List?p=1&prod=news&ymd=&m=')
soup = BeautifulSoup(req.text, 'html.parser')

print(soup.select("#content > div.page > a"))

for i in soup.select("#content > div.page > a") :
print("http://www.donga.com/news/List/Enter/" + i['href'])

노션 : 파트3번 링크와 권한 , 파트4번 권한요청, 파트 5번도 미리 요청 드립니다.

0

5

1

6-6 실습 문의

0

8

2

미션 06-02

0

10

1

yes24 수집 md 파일 만들 때

0

14

2

python main.py 실행시 게임이 실행이 안돼요

0

15

2

antigravity 대신 cursor를 활용해도 되나요?

0

19

1

뉴스 검색 분류 한도초과

0

25

2

완성자료

0

15

2

섹션5 노션링크 는 따로 없나요?

0

20

2

필기자료 사라졌나요?(실기 일주일만에 안돼서 재도전-_-)

0

22

2

안녕하세요 파이썬 관련 문의드립니다

0

268

1

개발자님 도와주세요

0

209

1

질문입니다

0

238

3

크롬드라이버 설치

0

261

1

크롬드라이버 설치질문

0

206

1

브라우저가 안나와요

0

230

1

에디터와 모듈 관련

0

198

1

여러 페이지 크롤링

0

270

3

패키지 설치 방법 알려주세요

0

397

3

셀레니움 설치 관련

0

251

1

12페이지 이후 print

0

199

3

파이참설치안하고 아나콘다의 주피터 노트북으로 강의내용 따라가도되나요~?

0

231

3

chromedriver 라이브러리

2

315

3

다음 실시간 검색어 클래스 추출 불가

1

280

1