인프런 커뮤니티 질문&답변
Scrapy 다양한 사용법: Scrapy 로 네이버 Open API 크롤링하기2 [12:12]
작성
·
354
답변 2
0
질문자분 궁금증은 강의에 나온 <\S+>를 써서 특수문자처럼 생긴 <p>태그를 없앴는데 뒤에 []대괄호는 왜 안없어지냐고 물어보신거 같네요 <\S+>는 1개 이상의 whitespace를 제거하는 정규표현식이고 찾아보니 p tag는 whitespace를 만든다고하네요 그래서 ptag만 제거된것같습니다
- The <p> tag generates a paragraph break. It is applied to a section of text that is a block of text separated from nearby blocks of text by a blank space and/or first-line indent.
0
잔재미코딩 DaveLee
지식공유자
그것은 요구사항에 따라, 정규표현식을 만든 것이니까요.
제 생각에는 <b> 이런 태그는 사람이 이해하는데에는 이상한 글자 같아서, 그것만 없앤 케이스를 설명드린 것이고요. 모든 특수문자를 다 없애는 정규표현식은 아니고, 대괄호는 사람이 이해하는데 크게 문제가 없는 것 같아서, 특별히 그런 부분을 삭제할 이유는 잘 모르겠어서요.





