inflearn logo
강의

Course

Instructor

Development of a real-time trend homepage (Python crawling + Flask)

Crawling other pages

실행결과가 이상합니다 실시간 순위 1위만 뜨네요

388

hazardous02127275

9 asked

0

파이썬 소스입니다

from flask import Flask, render_template
app = Flask(__name__)

import crawling

import requests
from bs4 import BeautifulSoup

@app.route('/')
def hello():

list_naver = crawling.naver()
list_daum = crawling.daum()

return render_template("index.html",
naver = list_naver,
daum = list_daum
)

@app.route('/about')
def about():
return "여기는 어바웃입니다."

if __name__ == '__main__':
app.run()







crawling 파일소스입니다
import requests
from bs4 import BeautifulSoup

def naver():
req = requests.get("https://comic.naver.com/webtoon/weekday.nhn")

soup = BeautifulSoup(req.text, 'html.parser')

list_naver = []

for i in soup.select("#realTimeRankFavorite > li"):
list_naver.append(i.find("a").text)

return list_naver


def daum():
req = requests.get("https://www.myktoon.com/web/league/webtoon/list.kt")

soup = BeautifulSoup(req.text, 'html.parser')

list_daum = []

for i in soup.select("#reagToon > ol > li"):
list_daum.append(i.find("h4").text)

return list_daum

python 웹-크롤링

Answer 6

0

bokchi

앗 ㅜㅜ 오래 지나지 않은 최신 강좌이긴 한데 코로나가 터지고 다음 사이트가 개편되어서 ㅠㅠ 죄송합니다 ㅠㅠ

0

hazardous02127275

그대로 끝까지 따라하고 싶어도 이미 안되는 사이트(다음)이라 에러한 부분이 커서 답답한 마음에 글 써봤습니다 물론 대부분의 응용it강좌가 최신화가 느리지만요..

0

bokchi

강의를 끝까지 따라하시고 다시 코드를 보시면 문제 해결 방법이 보일 수도 있으니

우선 강의를 끝까지 따라하시는 것을 권장드립니다~

0

bokchi

안녕하세요 감스트의웃음노예님!

beautifulsoup로 안돼는 것은 대부분 selenium을 사용하면 해결되는 경우가 많습니다.

실시간순위 1등을 추출하셨으면 나머지도 쉽게 하실 수 있을 것이라 생각합니다.

강의 내용 이외에는 코드 수정이 힘든 점 양해 부탁드립니다 ㅠㅠ

0

hazardous02127275

웹툰 순위가 나와있는 부분을 몇몇 사이트에서 크롤링해서 만들고 싶습니다

0

bokchi

안녕하세요 

url 부분이 이런 식으로 되어 있는데, 어떤부분을 어떻게 크롤링하고싶으진건지 스크린샷까지 첨부해주시면 좋을 것 같습니다.

comic.naver.com/webtoon/weekday.nhn
https://www.myktoon.com/web/league/webtoon/list.kt

교육 자료나 프로그램 소스 위치 알려주세요.

0

145

2

강의 교육자료 변경됨?

0

146

1

[셀레니움 사용해보기]웹 드라이버 경로관련

0

1636

1

[page숫자설정]int(page) 관련문의드립니다.

0

213

1

안녕하세요 강의 정말 잘봤습니다 ㅎㅎ

0

257

1

혹시 외부에서도 웹을 볼 수 있게 작동 하려면 어떻게 해야할까요?

0

240

1

print(soup.select("") 에서 "GET / HTTP/1.1" 500 - 에러 나네요.

0

414

3

엑셀 파일 생성이 안됩니다. ㅠㅠ

0

425

2

소스 올려봅니다

0

299

2

크롤링 관련해서 문의좀 드릴께요~

0

220

1

다른 editor 사용해도 되나요?

0

200

1

네이버 쇼핑 핫딜 크롤링 문제

0

393

3

flask에서 html 연결이 안됩니다ㅠㅜ

0

498

1

index.html 부분을 인식을 못하네요

0

461

5

저는 네이버 인기 검색어를 가져올려고하는데 못뽑아 오네요 혹시 네이버 보안 문제일까요???

1

196

1

Flask 실행하면 웹사이트 127.0.0.1:5000 포트 부분에서 404에러가 뜨네요 어떻게 해야되나요??

0

6299

6

저는 이렇게 venv부분이 다른 색으로 뜨는데 무슨 차이인가요??

0

398

1

윈도우 PyCharm 환경 설정들 처음부터 알려주세요

0

293

1

실시간

0

279

1

아톰에서 실행

0

323

1

코드가 잘안보이는건 wifi환경이라 그런건가요

0

165

1

크롤링 결과를 html 페이지에서 출력할 수 없습니다.

0

276

2

크롤링 결과가 다른 페이지가 아닌 현재 페이지에 나타나게 하려면 어떻게 해야 하나요?

0

319

2

크롤링 오류입니다;

1

416

2