sync/async fetcher 크롤링 전체가 안됩니다.
343
1 asked
안녕하세요.
강의 04-1, 04-2 코드를 그대로 실행시키면 전체 소스 크롤링이 안됩니다.
따로 설정해줘야하는 코드가 있을까요?
환경은 윈도우10, Python 3.9.1 입니다.


Answer 1
0
안녕하세요 구자웅님.
질문해주신 첫번째 코드를 아래와 같이 실행해본 결과 네이버와 구글의 모든 소스코드가 크롤링 된 것을 확인했습니다.
import requests
import time
def fetcher(session, url):
with session.get(url) as res:
return res.text
def main():
urls = ["https://www.naver.com", "https://www.google.com"]
with requests.Session() as session:
result = [fetcher(session, url) for url in urls]
print(result)
if __name__ == "__main__":
main()질문을 조금 더 자세하게 작성해주시면, 답변하기 조금 더 수월할 것 같습니다.
더불어 코드는 인프런의 에디터에 포함되어 있는 [코드 입력기]로 전체 코드를 복사 붙여넣기 해주시면 감사하겠습니다.
자세한 질문 내용 새로운 게시글로 작성해주시면, 곧바로 답변해드리겠습니다.
감사합니다 :)
대규모 크롤링 시 동시 요청 수 제어 방법
0
94
2
AWS LighSail 접근 불가
0
134
1
강의상의 readme와 배포되어 있는 것이 다른 것 같아요
0
97
1
book_scraper.py 에서 import get_secret 관련 질문
0
101
1
ThreadPoolExecutor 중간에 멈추는 법
0
292
1
몽고Db 기초 질문
0
196
1
async await 문법 질문
0
237
1
멀티 스레딩 질문..
0
194
1
교안 제공은 안되나요?
0
228
1
TypeError: field Config is defined without type annotation
0
259
1
RuntimeWarning: Enable tracemalloc to get the object allocation traceback
0
1709
1
jinja2templates
0
244
1
몽고DB 설정 관련 질문
0
243
1
비동기 함수를 동기적인 실행으로 만드는 부분 질문입니다
1
309
2
proxy 사용 질문
0
262
1
AWS Lightsail SSL handshake failed 오류 문의드립니다.
0
492
1
동시성과 병렬성
0
327
1
python select linter ? 오류
1
740
2
수업질문
1
353
1
response 객체에서 키값으로 조회 시 KeyError 발생
0
569
1
from config import get_secret 질문
0
387
1
파이썬 코루틴활용 영상 질문
0
280
1
가상환경 설정 질문
0
317
1
pydantic import error
0
1226
2

