現在最強のクロール技術: ScrapyとSeleniumを征服

xml을 parsing할때 <을 < 로 인식합니다.

2021-11-08T03:36:13.732Z

341

toaehddn

投稿した質問数 29

안녕하세요, 강사님.

requests로 url을 가져오고,

BeautifulSoup으로 그것의 content를 html.parser로 parsing하면,

결과를 print하면 < 을 &lt;로 인식합니다.

몇몇 <, >, ... 을 저런식으로 인식해서 그것을 고치려고 하는데 잘 안되네요

이럴땐 어떻게 해야하나요?

참고로 이전강의인 뷰티풀숩을 듣다가, 이어서 이 강의를 들으며 생긴 질문이라서 문의드립니다.

scrapy 웹-크롤링 selenium

回答 1

funcoding

2021-11-10T04:23:17.396Z

안녕하세요. 다음과 같이 파서를 바꿔보셔도 좋을 것 같은데 어떠신가요?

https://brownbears.tistory.com/414

toaehddn

2021-11-10T07:56:59.704Z

강사님 감사합니다. 완벽히 해결했습니다. 저도 나름 구글링을 해보고 했던것인데, 역시 아는만큼 보이고 구글링을한다고... 다시한번 또 배워갑니다^^

코딩을 잘 따라 한 것 같은데 오류가 발생하는 것 같습니다

2021-11-13T18:20:22.549Z

645

scrapy를 jupyter 환경에서 할 수 있나요

2021-11-12T03:23:11.926Z

372

[실전 크롤링: scrapy 크롤링 팁] 질문있습니다.

2021-11-11T15:03:34.100Z

326

[실전 크롤링: 지마켓 크롤링하며, scrapy 실전 활용법 익히기1] 5분50초쯤 질문

2021-11-10T12:44:57.016Z

232

[강력/최신 크롤링 기술: Scrapy 로 지마켓 크롤링하기1] 관련 질문

2021-11-10T08:05:49.979Z

286

pipelines.py에서 process_item내에서 print문이 작동을 하지 않네요 ㅠ

2021-11-05T13:39:52.744Z

295

PhantomJS 문의

2021-11-01T23:52:44.989Z

306

selenium 문의

2021-11-01T14:08:50.289Z

337

브라우저 제어해서 크롤링하기 - 처음강의 마지막부분 문의

2021-10-29T10:44:05.304Z

3013

on error 해결 방법 질문

2021-10-12T09:14:10.840Z

366

[팁] 윈도우 cmd 커맨드

2021-10-06T02:49:01.140Z

355

[팁]Chrome User Agent 아는법

2021-09-27T03:57:05.947Z

334

실전 크롤링: 브라우저를 제어해서 트위터 사이트 로그인 하기 질문

2021-09-15T07:07:46.178Z

258

동영상 강의 만드실 때 사용한 툴을 알려주실 수 있을까요?

2021-08-09T04:26:17.102Z

250

CSS Selector 에서 질문이 있습니다.

2021-08-03T14:40:15.885Z

446

pip install scrapy 오류

2021-08-01T14:15:12.512Z

497

셀레니움 실행불가

2021-07-11T08:09:18.942Z

1593

실전 크롤링: XPATH와 Selenium 활용해서 페이스북 로그인 하기 에서 질문이 있습니다.

2021-07-10T08:22:00.028Z

232

언제 get_text()를 사용하고 또 언제 .text를 사용하나요?

2021-07-08T06:30:14.354Z

300

강의교안자료 받을수있을까요?

2021-06-29T13:00:39.047Z

271

[강의 9:27관련 질문] price, title 열 위치

2021-06-23T15:08:49.611Z

162

div에 있는 클래스가 2개이면 어떻게 하나요?

2021-06-21T12:09:28.145Z

372

css 셀렉터에 대해 질문이 있습니다.

2021-06-21T06:10:22.350Z

155

계쏙 질문해서 죄송합니다...

2021-06-03T13:38:22.720Z

233

xml을 parsing할때 <을 &lt; 로 인식합니다.

xml을 parsing할때 <을 < 로 인식합니다.