inflearn logo
강의

Course

Instructor

Web Crawling and Web Page Automation with Practical Applications

Naver Shopping Crawling 1

네이버 쇼핑 크롤링 1 코드 사용 시, 접속 제한됐을 때의 해결 방법이 궁금합니다.

3164

작성자 없음

0 asked

0

import requests
from bs4 import BeautifulSoup

keyword = input("검색할 상품을 입력하세요 : ")
url = f"https://search.shopping.naver.com/search/all?&query={keyword}"

user_agent = "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/128.0.0.0 Safari/537.36"
headers = {"User-Agent" : user_agent}

req = requests.get(url, headers=headers)
html = req.text

soup = BeautifulSoup(html, "html.parser")
print(soup)

python 웹-크롤링 selenium beautifulsoup

Answer 1

0

communityai8509

안녕하세요, 인프런 AI 인턴입니다.

접속 제한 현상은 웹 서버가 봇이나 스크래핑 도구로부터의 접근을 막기 위해 설정한 방어 메커니즘 때문에 발생합니다. 네이버 쇼핑에서 비정상적인 접근으로 판단하여 접속을 제한한 것으로 보입니다. 이를 해결하기 위한 몇 가지 방법을 제시해 드립니다.

  1. IP 변경: 접속 제한이 IP 기반으로 이루어진 경우, IP를 변경하면 문제를 해결할 수 있습니다. VPN을 사용하거나 프록시 서버를 통해 IP를 변경해 보세요. 단, 네이버는 VPN 사용을 감지할 수도 있으니 이 점 유의해 주세요.

  2. 헤더 정보 수정: 현재 사용하고 계신 User-Agent 외에도, 완전히 브라우저로 인식될 수 있는 다른 정보(예: Referer, Accept-Language 등)를 헤더에 추가해 보세요.

  3. 요청 간격 조절: 서버에 과도한 요청을 보내지 않도록 요청 간에 일정 시간 간격을 두고 접근하세요. 너무 많은 요청이 짧은 시간 내에 이루어진 것을 감지하여 접속을 제한할 수 있으니, 각 요청 사이에 time.sleep() 함수를 사용해 시간 지연을 추가하는 것이 좋습니다.

  4. 세션 유지: requests.Session()을 사용하여 서버와의 세션을 유지하면서 요청을 보내 보세요. 이 방법은 서버가 요청을 더 자연스러운 브라우저 사용으로 인식하게 도와 줄 수 있습니다.

  5. 셀레니움 사용: 웹 페이지 자동화 도구인 셀레니움(Selenium)을 사용하면 실제 웹 브라우저를 동작시켜 사이트에 접근하므로, 서버로부터 일반적인 사용자로 인식될 확률이 높아집니다. 하지만 셀레니움은 크롤링 속도가 상대적으로 느릴 수 있으니, 사용에 앞서 고려해야 할 점입니다.

위 방법들을 시도해 보시기 바라며, 정책에 위반되지 않는 선에서 합법적인 데이터 수집을 해 주시기 바랍니다. 또한, 사이트의 이용 약관을 꼼꼼히 확인하고 존중하는 것이 중요합니다.

멜론 사이트 수집부터 안됩니다

0

56

1

강의 시점이랑 현재랑 네이버 사이트 변화가 많은거 같아서 질문드립니다.

0

54

1

-href 가져오기

0

90

2

수업내용 프로젝트의 완성된 코드는 제공이 안돼나요?

0

155

1

안녕하세요 쿠팡 크롤링 막힌거 같아요 3번돌리니깐 막았어요 해결방법없을까요?

0

3595

1

쿠팡 BeautifullSoup 헤더넣어도 막히네요

0

442

1

추가 강의 업데이트 있나요?

0

245

1

lambda 중에 문의가 있습니다.

0

269

1

텔레그램 sendMessage 시 400에러가 뜹니다.

0

898

2

ftp 로긴 문제입니다. ㅜ

0

402

2

네이버 쇼핑 크롤링 질문입니다.

0

366

1

XPATH 네이버에서 카페 찾는 과정 문의입니다.

1

312

1

셀레니움 By.XPATH 를 이용한 키워드 입력 작성 질문입니다.

0

664

2

쿠팡 이미지 파일 다운받기에서 동일하게 코드 작성 후 요청하였지만 파일 다운로드가 안됩니다.

0

805

2

파이썬에 키워드를 치는게 아닌...

0

274

2

50프로 수강중입니다~

0

217

1

제품 링크를 타고 들어가야 원하는 정보가 나오는 사이트

0

378

2

lst = lst50 + lst100 이거 대신에

0

321

2

증권, 메일 등 서비스 목록을 못가져와요 ㅠㅠ

1

279

1

네이버에 view탭이 업데이트가 됐는지 없어졌네요... ㅠㅠ

1

245

1

선생님이랑 똑같이 적었는데 저는 왜 오류가 날까요?ㅠ

0

354

2

네이버쇼핑 크롤링 문의

0

428

2

asyncio.run() cannot be called from a running event loop 에러 질문 드립니다

0

3891

4

멜론 유저에이전트 값 입력했음에도 창접속이안되여 ㅜㅜ

0

247

1