pd.read_html(url) 시 에러가 납니다
5562
7 asked
아래와 같이 코드 실행 시 에러가 납니다
pd.read_html(url) 부분입니다
ValueError Traceback (most recent call last)
<ipython-input-28-5d8f83db45ac> in <module>()
----> 1 pd.read_html(url)
5 frames
/usr/local/lib/python3.6/dist-packages/pandas/io/html.py in _parse_tables(self, doc, match, attrs)
545
546 if not tables:
--> 547 raise ValueError("No tables found")
548
549 result = []
Answer 1
1
판다스 내장함수인 read_html의 경우, 읽어올 html 문서 내에 <table> 태그가 있어야 수집이 가능합니다.
위에서 설정하신 url 변수를 참조하시어, 마우스 우클릭 > 검사 (혹은 Inspect)를 눌렀을 때 <table>태그가 나오는 지 확인해보시기 바랍니다 =)
0
라이브 강의 이후 변경사항
-
네이버 증권 일별 시세의 웹페이지가 변경되어 기존의 방법으로는 불러올 수 없습니다.
-
일별 시세 페이지에서 브라우저가 아닐 때 응답을 하지 않기 때문인데 이 때 requests 라는 라이브러리를 통해 HTTP 요청을 보내고 웹사이트의 소스코드를 받아와서 table 태그를 찾는 방법으로 받아올 수 있습니다.
-
아래의 코드를 보면 requests를 통해 HTTP 통신을 보내고 beautifulsoup을 통해 HTML 페이지 내에서 table 태그를 찾습니다.
-
table 태그를 read_html로 불러오면 판다스의 데이터프레임으로 읽어올 수 있습니다.
requests를 통한 HTTP 요청
- Requests: HTTP for Humans™ — Requests documentation
- Quickstart — Requests documentation # custom-headers
BeautifulSoup 을 통한 table 태그 찾기
페이지별 데이터 수집 함수 만들기
기출 마무리 방법
0
3
1
제가 AWS 에 배포했는데
0
5
0
빅이시 작업형2 기초 - 케이스 1~3 관련 문의
0
7
1
갑자기 stock_prediction은 어디서 발생한건가요?
0
11
1
pipeline/run-buy-pipeline 실행시 "LLM호출전체실패"에러발생
1
12
2
데이터프레임 슬라이싱 인덱싱 질문2
0
11
1
SSL 발급할때 HTTP로 진행하는 이유가 궁금합니다.
0
11
2
단일표본검정, 샤피로검정, 윌콕슨검정
0
20
2
강의자료 다운로드 여부
0
21
1
2-14.\x02 안보임 관련
0
16
0
문제에 첨부된 예시와 실제 출력된 샘플 비교
0
17
2
원핫 인코딩 관련
0
26
2
오늘 처음으로 자동매매가
1
28
2
타겟 분리
0
22
2
Id 삭제
0
25
2
roc_auc_score 질문: 작업형2 모의문제3 09분 48초
0
24
2
원핫인코딩 코드 질문
0
24
2
map 함수 사용 필수적인가요
0
31
2
conda create --name study python=3.11 접속 안됨
0
16
1
모의투자 현황
1
29
2
수강 기한 연장 문의드립니다.
0
39
2
34강 평가지표
0
32
2
103강 작업2형 전처리(레이블인코딩 부분) 오류
0
25
3
구글 Collab 접속 불가능
0
404
3

