inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

쉽게 처음하는 파이썬 고급 크롤링 [Scrapy, Selenium, Headless Chrome]

강력/최신 크롤링 기술: Scrapy shell 사용법 익히기

scrapy 크롤링 수행시 ffi.callback() 에러가 발생합니다

397

김영빈

작성한 질문수 49

0

안녕하세요? 강의 잘 듣고 있습니다
 
강의 초반부에 크롤링을 수행하면 (scrapy crawl gmarket) 다음과 같은 에러가 계속해서 발생합니다.
 
2022-07-06 08:10:41 [scrapy.downloadermiddlewares.robotstxt] ERROR: Error downloading <GET http://www.gmarket.co.kr/robots.txt>: Cannot allocate write+execute memory for ffi.callback(). You might be running on a system that prevents this. For more information, see https://cffi.readthedocs.io/en/latest/using.html#callbacks
 
항상 발생하는 것은 아니구요, 10번중에 8번정도 발생하면서 크롤링이 실패합니다.
나머지 2번은 또 크롤링이 잘 수행되네요.
 
제 사용환경은 m1 mac이구요
 
https://github.com/pyca/pyopenssl/issues/873
 
여기서 파이썬 버전을 3.10.2로 바꾸면 된다고 해서
미니콘다로 파이썬 버전을 3.10.2나 최신버전으로 변경시켜봤는데
여전히 에러가 발생합니다.. 혹시 해결방법이 있을까요?
 
추가)url이 다음과 같을 때는 에러 없이 잘 작동합니다..
start_urls = [
'http://promotion.gmarket.co.kr/Event/CouponZone.asp'
]
 

scrapy 웹-크롤링 bigdata selenium

답변 1

0

잔재미코딩 DaveLee

안녕하세요. 답변 도우미입니다.

 

M1 MAC 시스템이 있는 것은 아니기도 하고, 관련 에러를 본적은 없습니다. 아마도 해당 특수 환경에서만 일어나는 에러가 아닐까 생각은 들었습니다. 보여주신 에러를 구글에서 검색해보았는데요. 

https://www.reddit.com/r/scrapy/comments/mn27t7/m1_mac_cffi_error/

 

다음과 같이 수행하시면 된다고 커뮤니티에서 적혀있더라고요. 이 부분을 한번 해보시면 어떠실까요?

1. Make virtualenv by using conda

2. Turn the virtual environment, then install python3.10 by brew

3. Restart virtual environment and check the python version is 3.10

4. pip3 install Scrapy and other packages

 

감사합니다.

[REST API] data의 교환방식 질문

1

666

1

headless chrome 오류 문의

0

1488

1

Selenium 처리 속도 관련 문의드립니다.

0

1955

1

동적 웹사이트에서 element가 선택되지 않는 문제에 관해 질문드립니다

0

687

1

webdriver manager

0

440

1

__init__() got an unexpected keyword argument 'service' 에러 질문드립니다.

1

11713

1

Jupiter NoteBook 파일과 PDF 파일은 어디서 다운로드 받을 수 있나요?

0

444

1

scrapy option질문

1

244

1

response.css 질문드립니다.

0

372

1

selenium으로 여러페이지 수집시 질문

0

381

1

연습6 모범 코드: 로그인 시나리오 해보기

0

272

1

셀레니움 문법 업그레이드 , find_element_by_tag_name 오류

3

2832

1

셀레니움 버전 변경으로 인한 코드 변경

0

1285

1

headless error

0

441

1

질문있습니다!

0

463

1

안녕하세요 선생님! 질문있습니다.

0

233

1

selenium&scrapy문의

0

280

1

아래분(phantele47)과 동일한 문제가 발생해서 문의드립니다.

0

910

6

ip 차단을 피하려면 어떻게 해야 하나요?

0

3370

2

start_urls = ['']가 제공해주신 것과 다르게 작동합니다.

1

287

2

json, data = json.loads(response.body_as_unicode()) 부분에 문제가 있는 것 같습니다.

0

604

3

웹크롤링이 상대방 서버에 부담이 될 때는 어떻게 하나요~?

0

685

1

scrapy 윈도우버전의 설명은 따로 없나요??

0

332

1

json 으로 저장이 안되네요

0

2133

1