pd.read_html(url) 시 에러가 납니다
5562
작성한 질문수 7
아래와 같이 코드 실행 시 에러가 납니다
pd.read_html(url) 부분입니다
ValueError Traceback (most recent call last)
<ipython-input-28-5d8f83db45ac> in <module>()
----> 1 pd.read_html(url)
5 frames
/usr/local/lib/python3.6/dist-packages/pandas/io/html.py in _parse_tables(self, doc, match, attrs)
545
546 if not tables:
--> 547 raise ValueError("No tables found")
548
549 result = []
답변 1
1
판다스 내장함수인 read_html의 경우, 읽어올 html 문서 내에 <table> 태그가 있어야 수집이 가능합니다.
위에서 설정하신 url 변수를 참조하시어, 마우스 우클릭 > 검사 (혹은 Inspect)를 눌렀을 때 <table>태그가 나오는 지 확인해보시기 바랍니다 =)
0
라이브 강의 이후 변경사항
-
네이버 증권 일별 시세의 웹페이지가 변경되어 기존의 방법으로는 불러올 수 없습니다.
-
일별 시세 페이지에서 브라우저가 아닐 때 응답을 하지 않기 때문인데 이 때 requests 라는 라이브러리를 통해 HTTP 요청을 보내고 웹사이트의 소스코드를 받아와서 table 태그를 찾는 방법으로 받아올 수 있습니다.
-
아래의 코드를 보면 requests를 통해 HTTP 통신을 보내고 beautifulsoup을 통해 HTML 페이지 내에서 table 태그를 찾습니다.
-
table 태그를 read_html로 불러오면 판다스의 데이터프레임으로 읽어올 수 있습니다.
requests를 통한 HTTP 요청
- Requests: HTTP for Humans™ — Requests documentation
- Quickstart — Requests documentation # custom-headers
BeautifulSoup 을 통한 table 태그 찾기
페이지별 데이터 수집 함수 만들기
캐글 제출 점수
0
3
1
VCP 시그널 상태 추가 스크립트 에서 return_pct 조건
0
12
2
캐쉬가 업데이트 안됩니다.
0
11
2
기출 마무리 방법
0
14
1
제가 AWS 에 배포했는데
1
13
1
빅이시 작업형2 기초 - 케이스 1~3 관련 문의
0
10
1
갑자기 stock_prediction은 어디서 발생한건가요?
1
18
2
pipeline/run-buy-pipeline 실행시 "LLM호출전체실패"에러발생
1
17
2
데이터프레임 슬라이싱 인덱싱 질문2
0
11
1
SSL 발급할때 HTTP로 진행하는 이유가 궁금합니다.
0
13
2
단일표본검정, 샤피로검정, 윌콕슨검정
0
24
2
강의자료 다운로드 여부
0
24
1
2-14.\x02 안보임 관련
0
16
0
문제에 첨부된 예시와 실제 출력된 샘플 비교
0
19
2
원핫 인코딩 관련
0
27
2
오늘 처음으로 자동매매가
1
30
2
타겟 분리
0
24
2
Id 삭제
0
26
2
roc_auc_score 질문: 작업형2 모의문제3 09분 48초
0
26
2
원핫인코딩 코드 질문
0
25
2
map 함수 사용 필수적인가요
0
33
2
conda create --name study python=3.11 접속 안됨
0
20
2
모의투자 현황
1
29
2
구글 Collab 접속 불가능
0
404
3





