inflearn logo
강의

講義

知識共有

現在最強のクロール技術: ScrapyとSeleniumを征服

xml을 parsing할때 <을 &lt; 로 인식합니다.

333

toaehddn

投稿した質問数 29

0

안녕하세요, 강사님.
 
requests로 url을 가져오고,
BeautifulSoup으로 그것의 content를 html.parser로 parsing하면,
결과를 print하면 < 을 &lt;로 인식합니다.
 
몇몇 <, >, ... 을 저런식으로 인식해서 그것을 고치려고 하는데 잘 안되네요
이럴땐 어떻게 해야하나요?
 
참고로 이전강의인 뷰티풀숩을 듣다가, 이어서 이 강의를 들으며 생긴 질문이라서 문의드립니다.

scrapy 웹-크롤링 selenium

回答 1

0

funcoding

안녕하세요. 다음과 같이 파서를 바꿔보셔도 좋을 것 같은데 어떠신가요?

https://brownbears.tistory.com/414

 

0

toaehddn

강사님 감사합니다. 완벽히 해결했습니다. 저도 나름 구글링을 해보고 했던것인데, 역시 아는만큼 보이고 구글링을한다고... 다시한번 또 배워갑니다^^

코딩을 잘 따라 한 것 같은데 오류가 발생하는 것 같습니다

0

625

1

scrapy를 jupyter 환경에서 할 수 있나요

0

359

1

[실전 크롤링: scrapy 크롤링 팁] 질문있습니다.

0

313

1

[실전 크롤링: 지마켓 크롤링하며, scrapy 실전 활용법 익히기1] 5분50초쯤 질문

0

220

1

[강력/최신 크롤링 기술: Scrapy 로 지마켓 크롤링하기1] 관련 질문

0

278

1

pipelines.py에서 process_item내에서 print문이 작동을 하지 않네요 ㅠ

0

291

3

PhantomJS 문의

0

293

1

selenium 문의

0

328

1

브라우저 제어해서 크롤링하기 - 처음강의 마지막부분 문의

0

3003

1

on error 해결 방법 질문

0

356

1

[팁] 윈도우 cmd 커맨드

0

346

1

[팁]Chrome User Agent 아는법

0

327

1

실전 크롤링: 브라우저를 제어해서 트위터 사이트 로그인 하기 질문

0

253

1

동영상 강의 만드실 때 사용한 툴을 알려주실 수 있을까요?

0

237

1

CSS Selector 에서 질문이 있습니다.

0

434

2

pip install scrapy 오류

0

482

1

셀레니움 실행불가

0

1577

1

실전 크롤링: XPATH와 Selenium 활용해서 페이스북 로그인 하기 에서 질문이 있습니다.

0

225

1

언제 get_text()를 사용하고 또 언제 .text를 사용하나요?

0

286

1

강의교안자료 받을수있을까요?

0

262

1

[강의 9:27관련 질문] price, title 열 위치

0

159

1

div에 있는 클래스가 2개이면 어떻게 하나요?

0

367

1

css 셀렉터에 대해 질문이 있습니다.

0

147

1

계쏙 질문해서 죄송합니다...

0

227

1