inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[신규 개정판] 이것이 진짜 크롤링이다 - 실전편 (인공지능 수익화)

3단계 - 마지막 페이지 체크하는 방법

저장 시 일부 이미지가 안 보이는 문제에 대하여

258

이준용
1

강의 상에서는 눈에 띄지 않았으나, 일괄적으로 png 포맷으로 저장하면 원본 파일의 포맷이 다른 경우 이미지가 보이지 않더라고요...

해결책을 찾은 것 같지만 이와 별개로 강의는 약간 수정이 되어야 할 것 같아서 써 봅니다. (이미지 저장 부분)

images = driver.find_elements_by_css_selector('._image._listImage')
index = 1
for image in images:
    image_source = image.get_attribute('src')
    if '.PNG' in image_source:
        urlretrieve(image_source, f'{search_word}/{index}.png')
        index += 1
    elif '.jpg' in image_source:
        urlretrieve(image_source, f'{search_word}/{index}.jpg')
        index += 1
    if index > 500:
        break

elif를 더 쓰면 gif도 포함할 수 있습니다.

* enumerate를 쓰면 저장 안 하고 넘기는 파일에도 인덱스가 증가해서 중간에 숫자가 비어버리기 때문에 안 썼습니다.

답변 1

0

스타트코딩

안녕하세요. 이준용님

피드백 정말 감사합니다ㅎㅎ

 

제가 놓친 부분인 것 같네요~!

(모든 경우를 다 테스트 해보진 못해서 종종 놓치는 부분이 있습니다 ㅠㅠ) 

 

해당 강의는 이미지 저장 부분에서 

이미지 소스의 확장자와 동일하게 추출하도록 변경하면 좋을 것 같습니다. 

 

다른 수강생분들을 위해 

수업 노트에 테스트 후 소스파일을 남겨드리겠습니다.

 

- 스타트코딩 드림.

0

스타트코딩

제가 다시 테스트 해봤을 때는 원본이 png인 경우에도

jpg 파일로 잘 저장되네요

조금 더 확인이 필요해 보입니다..!