강의

멘토링

로드맵

인프런 커뮤니티 질문&답변

이다영님의 프로필 이미지
이다영

작성한 질문수

파이썬 증권 데이터 수집과 분석으로 신호와 소음 찾기

[2/8] 크롬브라우저를 통한 수집하고자 하는 데이터 확인하기

pd.read_html(url) 관련 질문

작성

·

257

1

이렇게 pandas로 html 문서를 읽어올 경우, html 문서에는 table 헤더 말고도 다양한 헤더들이 있을텐데 어떻게 자동으로 table 헤더 부분만 가져오는 건가요? 파이썬이 아니라 pandas로 불러왔기 때문에 데이터프레임 형태의 문서 일부분만 가져오는 건가요?

퀴즈

requests와 BeautifulSoup 라이브러리의 주요 역할에 대한 설명으로 가장 적절한 것은 무엇일까요?

requests는 데이터를 시각화하고 BeautifulSoup는 데이터베이스를 관리합니다.

requests는 웹사이트 콘텐츠를 가져오고 BeautifulSoup는 HTML을 분석합니다.

requests는 데이터 전처리, BeautifulSoup는 머신러닝 모델 생성에 사용됩니다.

requests는 사용자 인증 처리, BeautifulSoup는 웹 서버 구축에 사용됩니다.

답변 1

0

박조은님의 프로필 이미지
박조은
지식공유자

안녕하세요.

해당 기능은 html 문서 내에서 table 태그만을 가져옵니다.

그래서 table 태그 외에 데이터를 수집하려면 웹스크래핑(크롤링)에 대한 다른 방법으로 데이터를 가져와야 합니다.

판다스에서 table  태그만을 가져오기 위해 만들어진 기능이라고 보면 됩니다.

이다영님의 프로필 이미지
이다영

작성한 질문수

질문하기