• 카테고리

    질문 & 답변
  • 세부 분야

    데이터베이스

  • 해결 여부

    미해결

Provider 태그가 달라진 것 같습니다.

21.04.02 18:41 작성 조회수 190

0

안녕하세요 선생님,

언제나 질 좋은 강의 잘 듣고 있습니다.

이 챕터의 모든 강의를 듣고, 크롤링을 완료하여 SQL 데이터베이스에 데이터가 입력 된 것을 확인하였습니다.

하지만, provider가 모두 Null 값으로 떠서 어떤 이유인지 찾아 봤더니, 선생님께서 강의 하신 시점에 태그와, 현재 시점의 태그가 달라진 것 같다고 생각하였습니다.

(영상 지점: 12:21 / 14:10)

아래 사진이 현재 기준 태그입니다.

copy selector 버튼도 없고,, before 라는 생전 처음 보는 태그를 어떻게 크롤링에 적용하여 처리할 수 있는지 몰라 문의글 남깁니다.

감사합니다!!

답변 1

답변을 작성해보세요.

0

안녕하세요. 알려주셔서 감사합니다.

상용 웹사이트라서 더 와닿는 부분도 있고, 실전이긴 하지만, 가끔씩 변경되서, 결국에는 추후에는 개인적인 웹사이트를 구축해서, 크롤링을 연습하도록 해야할 듯하네요.

다음과 같이 변경하시면 좋을 것 같고요. 첨부파일도 업데이트하였습니다. 

감사합니다.

# 2021.04.03 : 웹페이지가 변경되어, 다음 provider CSS Selector 수정이 필요합니다
# 다음 코드와 실제 해당 웹페이지를 비교해보시면서, 영상과의 차이점까지 이해해보시면,
# 다양한 케이스에서 어떻게 CSS Selector 를 써서, 크롤링을 할 수 있을지 보다 이해하실 수 있을 것 같습니다.

        provider = soup.select_one('div.item-topinfo_headline > p > span > a')