inflearn logo
강의

講義

知識共有

実践でマスターするWebクロールとWebページ自動化&実戦活用

商品サムネイルをフルダウンロード

쿠팡 이미지 파일 다운받기에서 동일하게 코드 작성 후 요청하였지만 파일 다운로드가 안됩니다.

803

solim5351

投稿した質問数 4

0

쿠팡 상품 썸네일 전체 다운받기 강의에서

동일하게 코드 작성 후 실행하였지만, 다른 크롤링 정보는 정상작동하지만, 파일이 지정된 폴더로 다운이 되지 않습니다.

 

<작성한 코드>

import requests
from bs4 import BeautifulSoup

base_url = "https://www.coupang.com/np/search?component=&q="

keyword = input("검색할 상품을 입력하세요 : ")

url = base_url + keyword

headers = {
  "User-Agent" : "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/125.0.0.0 Safari/537.36"
}

cookie = {
  "a" : "b"
}

req = requests.get(url, timeout=5, headers=headers, cookies=cookie)
html = req.text

soup = BeautifulSoup(html, "html.parser")

items = soup.select("[class=search-product]")

rank = 1
for item in items:
  badge_rocket = item.select_one(".badge.rocket")
  if not badge_rocket:
    continue

  name = item.select_one(".name")
  price = item.select_one(".price-value")
  thumb = item.select_one(".search-product-wrap-img")
  link = item.select_one("a")['href']
  
  print(f"{rank}위")
  print(item["class"])
  print(name.text)
  print(f"{price.text} 원")
  print(f"https://www.coupang.com{link}")
  # print(thumb)
  
  if thumb.get("data-img-src"):
    img_url = f"http:{thumb.get('data-img-src')}"
  else:
    img_url = f"http:{thumb['src']}"
  print(img_url)
  print()

  img_req = requests.get(img_url)

  with open(f"07_coupang/{rank}.jpg", "wb") as f:
    f.write(img_req.content)
  
  
  rank+=1

키워드는 '노트북'이고, 저장하려는 폴더 이름은 07_coupang, 위치는 "C:\project\Webcrawling\07_coupang" 입니다.

어떤 것이 문제일까요?

python 웹-크롤링 selenium beautifulsoup 쿠팡 상품썸네일다운받기

回答 2

1

kimfl

8-0 쿠팡 크롤링을 위한 기본 설정의 수업 노트를 확인해 주세요.
코드에 추가되어야 하는게 있습니다.

1

communityai8509

안녕하세요, 인프런 AI 인턴입니다.

solim5351님의 질문과 유사한 경우를 해결한 기존 답변이 있어 소개해 드립니다. 상품 이미지 파일 다운로드가 작동하지 않는 문제에 대해 이미 다룬 내용이 있어, 그 답변이 도움이 될 수 있을 것 같습니다.

즉, 여러 질문들 중에서도 특히 파일 다운로드가 작동하지 않는 문제는 종종 발생하는 일반적인 문제 중 하나로, 주로 디렉토리 경로 오류, 파일 쓰기 권한 문제, URL 접근 불가 등 다양한 원인이 있을 수 있습니다.

solim5351님의 코드를 살펴보았을 때 몇 가지 검토해볼 점이 있습니다:

  1. 디렉토리 경로 확인: 07_coupang 디렉토리가 존재하는지와 정확한 경로가 맞는지 확인해보시기 바랍니다. 파이썬 스크립트를 실행하는 위치와 상대경로로 디렉토리가 설정되어 있을 때, 경로가 정확하지 않으면 파일이 저장되지 않습니다.
  2. 권한 문제: 파일을 저장하려는 디렉토리에 쓰기 권한이 있는지 확인해보세요. 때로는 특정 폴더에 대한 권한이 제한되어 파일 쓰기가 불가능할 수 있습니다.
  3. URL 접근 문제: 크롤링으로 얻은 이미지 URL이 외부에서 접근 가능한 상태인지 확인해보세요. 일부 사이트는 브라우저를 통해서만 특정 리소스에 접근할 수 있도록 설정되어 있을 수 있습니다.

비슷한 문제를 겪는 다른 학습자들에게 실제로 도움이 된 답변으로는, 쿠팡크롤링에서 쿠키로 해결하는 방법 질문이 있으며, 해당 해결 방법을 참고하시면 유용할 수 있습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

멜론 사이트 수집부터 안됩니다

0

55

1

강의 시점이랑 현재랑 네이버 사이트 변화가 많은거 같아서 질문드립니다.

0

53

1

-href 가져오기

0

88

2

수업내용 프로젝트의 완성된 코드는 제공이 안돼나요?

0

154

1

안녕하세요 쿠팡 크롤링 막힌거 같아요 3번돌리니깐 막았어요 해결방법없을까요?

0

3575

1

쿠팡 BeautifullSoup 헤더넣어도 막히네요

0

441

1

네이버 쇼핑 크롤링 1 코드 사용 시, 접속 제한됐을 때의 해결 방법이 궁금합니다.

0

3157

1

추가 강의 업데이트 있나요?

0

244

1

lambda 중에 문의가 있습니다.

0

269

1

텔레그램 sendMessage 시 400에러가 뜹니다.

0

896

2

ftp 로긴 문제입니다. ㅜ

0

399

2

네이버 쇼핑 크롤링 질문입니다.

0

366

1

XPATH 네이버에서 카페 찾는 과정 문의입니다.

1

311

1

셀레니움 By.XPATH 를 이용한 키워드 입력 작성 질문입니다.

0

662

2

파이썬에 키워드를 치는게 아닌...

0

274

2

50프로 수강중입니다~

0

217

1

제품 링크를 타고 들어가야 원하는 정보가 나오는 사이트

0

377

2

lst = lst50 + lst100 이거 대신에

0

318

2

증권, 메일 등 서비스 목록을 못가져와요 ㅠㅠ

1

279

1

네이버에 view탭이 업데이트가 됐는지 없어졌네요... ㅠㅠ

1

243

1

선생님이랑 똑같이 적었는데 저는 왜 오류가 날까요?ㅠ

0

352

2

네이버쇼핑 크롤링 문의

0

425

2

asyncio.run() cannot be called from a running event loop 에러 질문 드립니다

0

3880

4

멜론 유저에이전트 값 입력했음에도 창접속이안되여 ㅜㅜ

0

245

1