-
카테고리
-
세부 분야
데이터 엔지니어링
-
해결 여부
미해결
Scrapy 다양한 사용법: Scrapy 로 네이버 Open API 크롤링하기2 [12:12]
22.02.06 21:45 작성 조회수 188
0
궁금한게 있어서 여쭤봅니다.
re.sub 정규표현식을 써서 b태그 처리된것을 없앴습니다.<b></b>
근데 뒤에 아이폰 내용중에 대괄호로 시작하는 내용들은 안없어지나요? 대괄호도 특수문자 아닌가요? ----> [자급제]
쉽게 처음하는 파이썬 고급 크롤링 [Scrapy, Selenium, Headless Chrome]
Scrapy 다양한 사용법: Scrapy 로 네이버 Open API 크롤링하기2
강의실 바로가기
답변을 작성해보세요.
0
Seung Park
2022.07.30
질문자분 궁금증은 강의에 나온 <\S+>를 써서 특수문자처럼 생긴 <p>태그를 없앴는데 뒤에 []대괄호는 왜 안없어지냐고 물어보신거 같네요 <\S+>는 1개 이상의 whitespace를 제거하는 정규표현식이고 찾아보니 p tag는 whitespace를 만든다고하네요 그래서 ptag만 제거된것같습니다
- The <p> tag generates a paragraph break. It is applied to a section of text that is a block of text separated from nearby blocks of text by a blank space and/or first-line indent.
0
잔재미코딩 DaveLee
지식공유자2022.02.07
그것은 요구사항에 따라, 정규표현식을 만든 것이니까요.
제 생각에는 <b> 이런 태그는 사람이 이해하는데에는 이상한 글자 같아서, 그것만 없앤 케이스를 설명드린 것이고요. 모든 특수문자를 다 없애는 정규표현식은 아니고, 대괄호는 사람이 이해하는데 크게 문제가 없는 것 같아서, 특별히 그런 부분을 삭제할 이유는 잘 모르겠어서요.
답변 2