쉽게 처음하는 파이썬 고급 크롤링 [Scrapy, Selenium, Headless Chrome]

Scrapy 다양한 사용법: Scrapy 로 네이버 Open API 크롤링하기1

네이버 Open API 크롤링하기1 강의 질문

2022-02-11T09:36:12.827Z

198

허쿡

작성한 질문수 51

네이버 Open API 크롤링하기1 강의에서

self.start_urls로 start_urls가 여러 페이지의 리스트형태로 되어있는

경우 아래와 같이 for 문으로 풀어주신다고 하셨는데요.

for url in self.start_urls:

yield ~~

예를 들어

start_urls =[www.xxxx, www.yyyy, www.ssss] 로 여러 페이지가

리스트로 되어있는 경우 그냥

for url in start_urls로 써도 되지 않나요?

왜 self. 을 붙여서 하는지 궁금합니다.

답변 부탁드립니다. 감사합니다.

웹-크롤링 scrapy bigdata selenium

답변 1

잔재미코딩 DaveLee

2022-02-13T09:45:25.510Z

맞습니다. 말씀하신대로 start_urls 로 하셔도 됩니다.

프레임워크에 정의된 attribute 변수를 쓰기 위해서는 self 를 붙여야 하니까 그런 것이고요. 말씀하신대로 start_urls 로 하셔도 문제 없습니다. 항상 여러가지 방법이 있는 것이라고 가볍게 생각해주셔도 좋을 것 같습니다.

허쿡

2022-02-15T01:11:21.607Z

답변 감사합니다~!

[REST API] data의 교환방식 질문

2023-04-13T13:55:08.590Z

688

headless chrome 오류 문의

2023-02-11T15:58:38.228Z

1505

Selenium 처리 속도 관련 문의드립니다.

2023-01-28T06:40:09.301Z

1973

동적 웹사이트에서 element가 선택되지 않는 문제에 관해 질문드립니다

2022-12-23T08:30:29.046Z

706

webdriver manager

2022-12-08T18:43:40.754Z

462

__init__() got an unexpected keyword argument 'service' 에러 질문드립니다.

2022-08-16T15:52:08.241Z

11734

Jupiter NoteBook 파일과 PDF 파일은 어디서 다운로드 받을 수 있나요?

2022-08-03T13:14:49.341Z

481

scrapy option질문

2022-07-30T12:02:32.905Z

255

response.css 질문드립니다.

2022-07-27T18:58:43.530Z

384

scrapy 크롤링 수행시 ffi.callback() 에러가 발생합니다

2022-07-05T23:13:01.121Z

415

selenium으로 여러페이지 수집시 질문

2022-07-01T04:41:51.553Z

398

연습6 모범 코드: 로그인 시나리오 해보기

2022-06-30T17:14:36.497Z

290

셀레니움 문법 업그레이드 , find_element_by_tag_name 오류

2022-06-29T19:31:56.695Z

2851

셀레니움 버전 변경으로 인한 코드 변경

2022-06-29T14:38:40.512Z

1298

headless error

2022-06-29T13:23:55.859Z

459

질문있습니다!

2022-06-29T01:45:03.896Z

485

안녕하세요 선생님! 질문있습니다.

2022-06-25T13:56:25.953Z

249

selenium&scrapy문의

2022-06-12T08:55:46.477Z

298

아래분(phantele47)과 동일한 문제가 발생해서 문의드립니다.

2022-06-12T07:42:40.964Z

948

ip 차단을 피하려면 어떻게 해야 하나요?

2022-06-08T08:38:08.595Z

3431

start_urls = ['']가 제공해주신 것과 다르게 작동합니다.

2022-05-30T07:59:43.670Z

305

json, data = json.loads(response.body_as_unicode()) 부분에 문제가 있는 것 같습니다.

2022-05-26T07:59:26.698Z

622

웹크롤링이 상대방 서버에 부담이 될 때는 어떻게 하나요~?

2022-04-13T16:57:48.700Z

703

scrapy 윈도우버전의 설명은 따로 없나요??

2022-04-13T16:20:25.535Z

343