• 카테고리

    질문 & 답변
  • 세부 분야

    데이터 분석

  • 해결 여부

    미해결

pd.read_html(url) 관련 질문

22.01.14 15:32 작성 조회수 102

1

이렇게 pandas로 html 문서를 읽어올 경우, html 문서에는 table 헤더 말고도 다양한 헤더들이 있을텐데 어떻게 자동으로 table 헤더 부분만 가져오는 건가요? 파이썬이 아니라 pandas로 불러왔기 때문에 데이터프레임 형태의 문서 일부분만 가져오는 건가요?

답변 1

답변을 작성해보세요.

0

안녕하세요.

해당 기능은 html 문서 내에서 table 태그만을 가져옵니다.

그래서 table 태그 외에 데이터를 수집하려면 웹스크래핑(크롤링)에 대한 다른 방법으로 데이터를 가져와야 합니다.

판다스에서 table  태그만을 가져오기 위해 만들어진 기능이라고 보면 됩니다.