강의

멘토링

커뮤니티

Cộng đồng Hỏi & Đáp của Inflearn

Hình ảnh hồ sơ của jschool01225639
jschool01225639

câu hỏi đã được viết

Dễ dàng dành cho người mới bắt đầu Thu thập thông tin nâng cao Python [Scrapy, Selenium, Headless Chrome]

Các cách sử dụng khác nhau của Scrapy: Thu thập thông tin API mở Naver với Scrapy 2

Scrapy 다양한 사용법: Scrapy 로 네이버 Open API 크롤링하기2 [12:12]

Viết

·

373

0

 

궁금한게 있어서 여쭤봅니다.

re.sub 정규표현식을 써서 b태그 처리된것을 없앴습니다.<b></b>

 

근데 뒤에 아이폰 내용중에 대괄호로 시작하는 내용들은 안없어지나요? 대괄호도 특수문자 아닌가요? ----> [자급제]

웹-크롤링seleniumscrapybigdata

Câu trả lời 2

0

질문자분 궁금증은 강의에 나온 <\S+>를 써서 특수문자처럼 생긴 <p>태그를 없앴는데 뒤에 []대괄호는 왜 안없어지냐고 물어보신거 같네요 <\S+>는 1개 이상의 whitespace를 제거하는 정규표현식이고 찾아보니 p tag는 whitespace를 만든다고하네요 그래서 ptag만 제거된것같습니다

  • The <p> tag generates a paragraph break. It is applied to a section of text that is a block of text separated from nearby blocks of text by a blank space and/or first-line indent.

0

funcoding님의 프로필 이미지
funcoding
Người chia sẻ kiến thức

그것은 요구사항에 따라, 정규표현식을 만든 것이니까요.

제 생각에는 <b> 이런 태그는 사람이 이해하는데에는 이상한 글자 같아서, 그것만 없앤 케이스를 설명드린 것이고요. 모든 특수문자를 다 없애는 정규표현식은 아니고, 대괄호는 사람이 이해하는데 크게 문제가 없는 것 같아서, 특별히 그런 부분을 삭제할 이유는 잘 모르겠어서요.

 

Hình ảnh hồ sơ của jschool01225639
jschool01225639

câu hỏi đã được viết

Đặt câu hỏi