• 카테고리

    질문 & 답변
  • 세부 분야

    데이터 엔지니어링

  • 해결 여부

    미해결

Scrapy 다양한 사용법: Scrapy 로 네이버 Open API 크롤링하기2 [12:12]

22.02.06 21:45 작성 조회수 188

0

 

궁금한게 있어서 여쭤봅니다.

re.sub 정규표현식을 써서 b태그 처리된것을 없앴습니다.<b></b>

 

근데 뒤에 아이폰 내용중에 대괄호로 시작하는 내용들은 안없어지나요? 대괄호도 특수문자 아닌가요? ----> [자급제]

답변 2

·

답변을 작성해보세요.

0

Seung Park님의 프로필

Seung Park

2022.07.30

질문자분 궁금증은 강의에 나온 <\S+>를 써서 특수문자처럼 생긴 <p>태그를 없앴는데 뒤에 []대괄호는 왜 안없어지냐고 물어보신거 같네요 <\S+>는 1개 이상의 whitespace를 제거하는 정규표현식이고 찾아보니 p tag는 whitespace를 만든다고하네요 그래서 ptag만 제거된것같습니다

  • The <p> tag generates a paragraph break. It is applied to a section of text that is a block of text separated from nearby blocks of text by a blank space and/or first-line indent.

0

그것은 요구사항에 따라, 정규표현식을 만든 것이니까요.

제 생각에는 <b> 이런 태그는 사람이 이해하는데에는 이상한 글자 같아서, 그것만 없앤 케이스를 설명드린 것이고요. 모든 특수문자를 다 없애는 정규표현식은 아니고, 대괄호는 사람이 이해하는데 크게 문제가 없는 것 같아서, 특별히 그런 부분을 삭제할 이유는 잘 모르겠어서요.