• 카테고리

    질문 & 답변
  • 세부 분야

    데이터 분석

  • 해결 여부

    미해결

인프런 크롤링 질문

21.01.21 00:31 작성 조회수 118

1

현재 인프런 개편되서 강의대로 하기는 힘들어서 그냥 메인 페이지를 크롤링 해 와서 print로 찍은 것과 실제 인프런 사이트에서 F12로 element를 비교해 보는데 왜 정보가 다른 것인지 모르겠습니다.

from bs4 import BeautifulSoup

import urllib.request as req

import sys

import io

sys.stdout = io.TextIOWrapper(sys.stdout.detach(), encoding='utf-8')

sys.stderr = io.TextIOWrapper(sys.stderr.detach(), encoding='utf-8')

url = "https://www.inflearn.com/"

res = req.urlopen(url).read()

soup = BeautifulSoup(res, "html.parser")

main= soup.select("#pg___main")

print(main)

이렇게 찍어보면 해당id : pg___main  밑에 section을 다 못가져올뿐만 아니라 배치도 다릅니다.

이런 것부터 해결이 안되니...진도가 너무 안나갑니다...ㅠ.ㅠ

문제는 매 강의마다 이러한 것들이 너무 많네요...

답변 1

답변을 작성해보세요.

0

안녕하세요. 이경님

항상 사이트들이 변화하고 있습니다.

디자인이 바뀌고 dom 구조가 바뀌어서 엘리먼트들이 자주 변경되는대요

저도 주기적으로 바뀐 부분을 github 소스코드에 올려놓고 있습니다.

최근에 몇 개가 또 변경된것 같은데 저도 지금 반영해서 업데이트 후 공지하도록 하겠습니다.

불편을 끼쳐드려 죄송해요~

CSS 선택자 부분을 더 열심히 공부하시면 원리는 변하지 않으니 응용하는대 무리가 없을 것으로 생각됩니다.

감사합니다.