인프런 영문 브랜드 로고
인프런 영문 브랜드 로고

Inflearn Community Q&A

kshssi's profile image
kshssi

asked

[New Revised Edition] This is Real Crawling - Practical Edition (Artificial Intelligence Monetization)

i의 값에 따라서 다른 태그로 가져오는게 이해가 잘 안됩니다

Written on

·

159

1

i값에 따라서 target 값의 리스트중에 0번과 1번을 불러오는부분에서 

 

i값은 전체 고양이 섬네일 이미지 갯수의 숫자 일탠데 

2번째 고양이 이미지부터는 i가 2,3,4,.....

이렇게 반환되는거 아닌가요?

 

반대로 i가 고양이 섬네일 이미지 안에서의 큰 이미지 태그의 갯수라면 마지막에 파일 이미지명은 어떻게 순차적으로

1, 2, 3, 4, .... 이렇게 나오는거죠?

웹-크롤링python

Answer 1

0

startcoding님의 프로필 이미지
startcoding
Instructor

안녕하세요.

코딩을 가장 쉽게 알려주는 크리에이터 스타트코딩입니다. 

 

for i, img in enumerate(imgs, 1):
    # 이미지를 클릭해서 큰 사이즈를 찾아요
    # 클릭하다보면 element click intercepted 에러가 나요
    # javascript 로 클릭을 직접 하도록 만들어주면 됩니다.
    browser.execute_script("arguments[0].click();", img)
    time.sleep(1)

    # 큰 이미지 주소 추출
    if i == 1:
        target = browser.find_elements_by_css_selector("img.n3VNCb")[0]
    else:
        target = browser.find_elements_by_css_selector("img.n3VNCb")[1]

    img_src = target.get_attribute('src')

    # 이미지 다운로드
    # 크롤링 하다보면 HTTP Error 403: Forbidden 에러가 납니다.
    opener = urllib.request.build_opener()
    opener.addheaders = [('User-Agent', 'Mozila/5.0')]
    urllib.request.install_opener(opener)
    urllib.request.urlretrieve(img_src, f'06_구글_이미지_크롤링/파이썬/{i}.jpg')

 

i는 이미지의 번호입니다.

imgs 리스트의 첫번째 원소 = 1

imgs 리스트의 두번째 원소 = 2

 

이렇게 가죠

그래서 마지막에 이미지를 저장할 때도 {i}.jpg 로 저장하니

1.jpg 2.jpg 로 저장 됩니다. 

 

 

감사합니다. 

좋은 하루 되세요 ^^

- 스타트코딩 드림.

 

kshssi's profile image
kshssi

asked

Ask a question