왜 크롤링이안될까요?ㅠㅠ
239
작성한 질문수 7
강사님 코드로 똑같이 실행했는데 이렇게해서 오류가 나는데 아무리 생각해도 뭐가 잘못된건지모르겠습니다
답변 1
0
안녕하세요.
우선 혹시... allowed_domains 가 본래 코드에 없는 것 아닌가요? 하도 오랜만이라서, 저도 찾아봤는데, 해당 변수값이 없는 것 같아서요. 이 부분 확인부탁드리고요.
다음으로, 해당 사이트가 실제 사이트다보니, 해당 사이트가 업데이트되며, 수시로 변경이 되는 부분이 있습니다. 그렇더라도, css selector 만 다시 한번 확인해보시면서, 적용해보시면 가능은 하신데요. 우선 다음과 같이 해당 코드에서 li[id] 부분을 수정해서, 관련 코드에도 업데이트를 하였습니다.
2021년 5월 3일 자료 업데이트 사항:
gmarket_best.py 파일의 다음 코드가 변경되어 관련 코드를 업데이트하였습니다. 해당 사이트가 실제 사이트이다보니, 사이트가 변경되어 CSS Selector 를 그때마다 변경하였으며, 이와 같이 css selector 사용법만 잘 적용하신다면, 크롤링이 가능합니다.
------------
# 2021.05.03 해당 사이트의 li 태그가 변경되어, 기존 li[id] 를 li 로 변경하였습니다. 참고부탁드립니
#titles = response.css('div.best-list > ul > li[id] > a::text').getall()
#prices = response.css('div.best-list > ul > li[id] > div.item_price > div.s-price > strong > span > span::text').getall()
titles = response.css('div.best-list > ul > li > a::text').getall()
prices = response.css('div.best-list > ul > li > div.item_price > div.s-price > strong > span > span::text').getall()
--------------
해당 자료는 다음 강의에 첨부파일로 업데이트하여 넣어놓았습니다.
- 실전 크롤링: 지마켓 크롤링하며, scrapy 실전 활용법 익히기1
감사합니다.
코딩을 잘 따라 한 것 같은데 오류가 발생하는 것 같습니다
0
645
1
scrapy를 jupyter 환경에서 할 수 있나요
0
372
1
[실전 크롤링: scrapy 크롤링 팁] 질문있습니다.
0
326
1
[실전 크롤링: 지마켓 크롤링하며, scrapy 실전 활용법 익히기1] 5분50초쯤 질문
0
232
1
[강력/최신 크롤링 기술: Scrapy 로 지마켓 크롤링하기1] 관련 질문
0
286
1
xml을 parsing할때 <을 < 로 인식합니다.
0
341
1
pipelines.py에서 process_item내에서 print문이 작동을 하지 않네요 ㅠ
0
295
3
PhantomJS 문의
0
306
1
selenium 문의
0
337
1
브라우저 제어해서 크롤링하기 - 처음강의 마지막부분 문의
0
3013
1
on error 해결 방법 질문
0
366
1
[팁] 윈도우 cmd 커맨드
0
355
1
[팁]Chrome User Agent 아는법
0
334
1
실전 크롤링: 브라우저를 제어해서 트위터 사이트 로그인 하기 질문
0
258
1
동영상 강의 만드실 때 사용한 툴을 알려주실 수 있을까요?
0
250
1
CSS Selector 에서 질문이 있습니다.
0
446
2
pip install scrapy 오류
0
497
1
셀레니움 실행불가
0
1593
1
실전 크롤링: XPATH와 Selenium 활용해서 페이스북 로그인 하기 에서 질문이 있습니다.
0
232
1
언제 get_text()를 사용하고 또 언제 .text를 사용하나요?
0
300
1
강의교안자료 받을수있을까요?
0
271
1
[강의 9:27관련 질문] price, title 열 위치
0
162
1
div에 있는 클래스가 2개이면 어떻게 하나요?
0
372
1
css 셀렉터에 대해 질문이 있습니다.
0
155
1





