inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

파이썬 입문 및 웹 크롤링을 활용한 다양한 자동화 어플리케이션 제작하기

파이썬 urllib을 활용한 웹에서 필요한 데이터 추출하기(2)

과제 질문

218

라휘언

작성한 질문수 6

0

//파이참 사용자입니다.

import urllib.request as req
from urllib.parse import urlencode

API = "https://nv.veta.naver.com/fxshow"

values = {
'su': 'SU10078',
'nrefreshx': '0'
}

print('before', values)
params = urlencode(values)
print('after', params)
url = API+"?"+params
print("요청 URL : ", url)


f = req.urlopen(url).read()
savePath = "E:/test/homeworkIMG.png"
with open(savePath, 'wb') as saveFile:
saveFile.write(f)

print('다운로드 완료')

이렇게 코딩을 해서 다운로드는 잘 되는데 막상 이미지 파일을 열어보려고 하면 파일 형식이 지원되지 않는다고 합니다.

그런데 URL을 따라가보면 파일형식이 jpg, png계속 바뀌던데.. 어떻게 해야 할까요?

jpg로 코드를 만들어도, png로 만들어도 이미지가 나오지 않는건 똑같습니다.

웹-크롤링 python

답변 1

0

좋은사람

안녕하세요.

https://nv.veta.naver.com/fxshow?su=SU10078&nrefreshx=0

경로를 확인해보시면 이미지가 아닌 html 페이지가 열리고 그 안에 이미지가 있습니다.

또한 jpg 및 png 파일이 랜덤으로 생성되는게 말씀하신대로 맞습니다.

즉 해당 경로로 요청하셔서 뒷 부분에서 배울 selenium 또는 bs4 등을 활용해서

다시 파싱하셔야 이미지를 저장하실 수 있습니다.

지금은 해당 과제를 수행하기에는 힘드실것  같습니다. 뒷 부분 수업을 더 들으셔야 될 것 같네요.

해당 예제 파일은 제가 곧 수정해놓겠습니다.

현재 예제에서 error 발생

0

367

3

유튜브 동영상 다운로드

0

1448

2

Atom 에디터 관련

0

337

1

위시켓 폼데이터

0

274

1

스케줄러 사용 관련 질문 드립니다

0

627

1

selenium 에러

0

428

1

Progress bar 쓰레드 관련

0

489

1

Install Package 관련 문의

0

328

1

tkinter 샘플 코드 실행 오류 건

0

1267

1

4-7-6 네이버 & 카카오 주식 정보 가져오기

0

381

1

네이버자동로그인_by_selenium

0

876

1

위시캣 로그인 처리 및 크롤링 질문

0

345

1

2-8-1 네이버이미지 크롤링 질문

1

604

3

li:nth-of-type 질문

0

350

2

에러가 뜨는데 잘 모르겠어요ㅠ

0

401

2

Install Packages 항목이 안보이는 이유가 뭘까요?

0

400

2

환경변수 Path 설정 방법

0

631

1

웹 브라우저 없는 스크랩핑 및 파싱 실습(1) - 인프런

0

333

1

웹 브라우저 없는 스크랩핑 및 파싱 실습(1) -git주소

0

475

3

download2-8-1. py질문

0

203

1

ip 차단 당하는 거 같은데 아무리 랜덤주고, sleep 줘도 안 되는데 다른 방법 더 있을까요??

0

645

1

인프런 환경이 바뀌어서 제나름대로 하는데

0

196

1

다시올려주신 예제파일로하는데

0

190

1

아직도 에러가뜨나보네요?

0

584

1