아래의 질문에 이어서 답변 부탁드리겠습니다.

Question

강사님을 너무 귀찮게 해드리네요

아래 selenium과 scrapy 를 질문한 사람입니다.

결국 강사님의 답변은 네트워크 헤더를 분석해서 해더를 만들어 전송해 selenium의 효과를 내야 한다는 말씀이신지요?

만약 그렇다면 그러한 고급 과정 개설도 생각하고 계신지요?

Answer

어이쿠 아닙니다. 가볍게만 말씀드리면, 다음 파이썬 입문과 크롤링 기초 부트캠프 강좌에서 다뤘던 다음 강의처럼 네트워크를 통해 어떤 요청이 들어가는지를 체크해서 직접 그 API를 그대로 보내는 것이예요. AJAX 와 같은 동적 요청도 결국 네트워크를 통해 요청이 들어가니까, 어떻게든 해당 API를 simulation해서 요청에 대해 응답을 받을 수 있게만 한다면, 굳이 selenium을 안써도 되거든요. 물론 다 되는 것은 아니고, 세션 정보들이 들어있다보니 쉽지는 않은데요. 방대한 데이터를 수집하려면, selenium만을 쓰기가 조금 불안할때도 있어서, 이런 방식을 어떻게든 해보려고 합니다.

패턴으로 실습하며 익히기: 실전 로그인이 필요한 웹페이지 크롤링

고급 과정의 수요가 어느정도인지는 조금 고민이 되는데, 고려는 하고 있습니다.

감사합니다.!

Seongc좋은ᅵᅵheol Kim

아래의 질문에 이어서 답변 부탁드리겠습니다.

이 글과 비슷한 Q&A

선생님이랑 똑같이 적었는데 저는 왜 오류가 날까요?ㅠ

1강에서 localhost:4000 접속

이것도 로직이 바뀐 것 같아요.

환불요청 실습 진행 적용 불가