Scrapy 다양한 사용법: Scrapy 로 네이버 Open API 크롤링하기2 [12:12]
389
작성한 질문수 3
궁금한게 있어서 여쭤봅니다.
re.sub 정규표현식을 써서 b태그 처리된것을 없앴습니다.<b></b>
근데 뒤에 아이폰 내용중에 대괄호로 시작하는 내용들은 안없어지나요? 대괄호도 특수문자 아닌가요? ----> [자급제]
답변 2
0
질문자분 궁금증은 강의에 나온 <\S+>를 써서 특수문자처럼 생긴 <p>태그를 없앴는데 뒤에 []대괄호는 왜 안없어지냐고 물어보신거 같네요 <\S+>는 1개 이상의 whitespace를 제거하는 정규표현식이고 찾아보니 p tag는 whitespace를 만든다고하네요 그래서 ptag만 제거된것같습니다
- The <p> tag generates a paragraph break. It is applied to a section of text that is a block of text separated from nearby blocks of text by a blank space and/or first-line indent.
0
그것은 요구사항에 따라, 정규표현식을 만든 것이니까요.
제 생각에는 <b> 이런 태그는 사람이 이해하는데에는 이상한 글자 같아서, 그것만 없앤 케이스를 설명드린 것이고요. 모든 특수문자를 다 없애는 정규표현식은 아니고, 대괄호는 사람이 이해하는데 크게 문제가 없는 것 같아서, 특별히 그런 부분을 삭제할 이유는 잘 모르겠어서요.
[REST API] data의 교환방식 질문
1
666
1
headless chrome 오류 문의
0
1488
1
Selenium 처리 속도 관련 문의드립니다.
0
1955
1
동적 웹사이트에서 element가 선택되지 않는 문제에 관해 질문드립니다
0
687
1
webdriver manager
0
441
1
__init__() got an unexpected keyword argument 'service' 에러 질문드립니다.
1
11713
1
Jupiter NoteBook 파일과 PDF 파일은 어디서 다운로드 받을 수 있나요?
0
444
1
scrapy option질문
1
244
1
response.css 질문드립니다.
0
372
1
scrapy 크롤링 수행시 ffi.callback() 에러가 발생합니다
0
397
1
selenium으로 여러페이지 수집시 질문
0
381
1
연습6 모범 코드: 로그인 시나리오 해보기
0
272
1
셀레니움 문법 업그레이드 , find_element_by_tag_name 오류
3
2832
1
셀레니움 버전 변경으로 인한 코드 변경
0
1285
1
headless error
0
441
1
질문있습니다!
0
463
1
안녕하세요 선생님! 질문있습니다.
0
233
1
selenium&scrapy문의
0
280
1
아래분(phantele47)과 동일한 문제가 발생해서 문의드립니다.
0
910
6
ip 차단을 피하려면 어떻게 해야 하나요?
0
3370
2
start_urls = ['']가 제공해주신 것과 다르게 작동합니다.
1
287
2
json, data = json.loads(response.body_as_unicode()) 부분에 문제가 있는 것 같습니다.
0
604
3
웹크롤링이 상대방 서버에 부담이 될 때는 어떻게 하나요~?
0
685
1
scrapy 윈도우버전의 설명은 따로 없나요??
0
332
1





