response.get 질문입니다.

Question

안녕하세요. 개인적으로 스크래핑 기술로 간단한 앱을 만들어보고 싶어서 이 강좌를 수강하고 있습니다. response.get 으로 스크래핑이 제대로 실행이 되지 않는 사이트들도 있나요?

이를 테면, 밑의 코드를 보면 프린트 값이 빈 [] 이거나 아무값이 표시되지 않습니다. 이러한 경우에는 어떻게 해야하나요?

import requests
import pyautogui
from bs4 import BeautifulSoup

# keyword = pyautogui.prompt('USE YOUR HEAD AND SEARCH IT.')

# response = requests.get(f"https://search.naver.com/search.naver?where=news&ie=utf8&sm=nws_hty&query={keyword}")
response = requests.get("https://www.fromjapan.co.jp/en/item/search/kaptain+sunshine/Al_11_Yh_RaSuBpOmRm_N_N_0A00ja00_N/lgk-link_top_search")
html = response.text
soup = BeautifulSoup(html, "html.parser")

items = soup.select(".shop-item")
print(items)
for item in items:
    print(item)

Answer

안녕하세요!동적인 페이지에서는 requests + bs4 조합으로 크롤링이 되지 않습니다.동적인 페이지 크롤링 방법은 남은 강의에서 배울 수 있는데selenium을 이용하거나, 네트워크 분석을 통해 동적으로 일어나는 요청을 찾아 내는 방법이 있습니다.남은 강의를 공부하시면 해결할 수 있을 겁니다 ^^

Answer

답변감사드립니다. 킵고잉 하겠습니다.ㅎ

Nosugar

response.get 질문입니다.

이 글과 비슷한 Q&A

네이버쇼핑 무한스크롤 안되시는분들 모바일네이버로 실습해보세요

모의문제 작업1 데이터 불러오기

슬라이싱 할때

안녕하세요! 강의자료 부탁드리겠습니다!