pd.read_html(url) 시 에러... - Inflearn | Cộng đồng Hỏi & Đáp

Mã Watch Me: Phân tích dữ liệu Python cho Joorin

Thu thập các cổ phiếu riêng lẻ: Thu thập dữ liệu giá cổ phiếu bằng các hàm tích hợp FinanceDataReader và Pandas

pd.read_html(url) 시 에러가 납니다

2021-02-14T07:01:49.505Z

5545

hotsan

7 câu hỏi đã được viết

아래와 같이 코드 실행 시 에러가 납니다

pd.read_html(url) 부분입니다

ValueError                                Traceback (most recent call last)
<ipython-input-28-5d8f83db45ac> in <module>()
----> 1 pd.read_html(url)

5 frames
/usr/local/lib/python3.6/dist-packages/pandas/io/html.py in _parse_tables(self, doc, match, attrs)
    545 
    546         if not tables:
--> 547             raise ValueError("No tables found")
    548 
    549         result = []

python pandas numpy

Câu trả lời 1

sungeun6kim1465

2021-03-02T09:00:51.448Z

판다스 내장함수인 read_html의 경우, 읽어올 html 문서 내에 <table> 태그가 있어야 수집이 가능합니다.

위에서 설정하신 url 변수를 참조하시어, 마우스 우클릭 > 검사 (혹은 Inspect)를 눌렀을 때 <table>태그가 나오는 지 확인해보시기 바랍니다 =)

hotsan

2021-03-05T11:20:00.736Z

table 코드가 있는데도 그렇습니다.

sungeun6kim1465

2021-03-17T01:11:01.483Z

학습자님, 강의 원작자인 박조은 강사님께 해당 사항을 문의드려

관련 오류를 해결 / 강의 자료에 반영 완료하였습니다.

라이브 강의 이후 네이버 일별 시세 페이지가 변경이 되어 일부 오류가 발생한 것으로 보입니다.

학습에 지장을 드려 정말 죄송합니다.

라이브 강의 이후 변경사항

네이버 증권 일별 시세의 웹페이지가 변경되어 기존의 방법으로는 불러올 수 없습니다.
일별 시세 페이지에서 브라우저가 아닐 때 응답을 하지 않기 때문인데 이 때 requests 라는 라이브러리를 통해 HTTP 요청을 보내고 웹사이트의 소스코드를 받아와서 table 태그를 찾는 방법으로 받아올 수 있습니다.
아래의 코드를 보면 requests를 통해 HTTP 통신을 보내고 beautifulsoup을 통해 HTML 페이지 내에서 table 태그를 찾습니다.
table 태그를 read_html로 불러오면 판다스의 데이터프레임으로 읽어올 수 있습니다.

requests를 통한 HTTP 요청

# 일별 시세 페이지를 읽어 올 때 브라우저가 아니면 응답을 하지 않기 때문에 브라우저 인 것 처럼 요청을 보냅니다.
# 응답으로 HTML 페이지 전체를 받아옵니다.
import requests

headers = {'user-agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.96 Safari/537.36'}

response = requests.get(url, headers=headers)

BeautifulSoup 을 통한 table 태그 찾기

# BeautifulSoup 을 통해 html 페이지 내의 table 태그를 찾습니다.
from bs4 import BeautifulSoup as bs

html = bs(response.text, "lxml")
html_table = html.select("table")
len(html_table)

# html에서 찾은 table 태그를 pandas 로 읽어옵니다.
table = pd.read_html(str(html_table))
table[0].dropna()

페이지별 데이터 수집 함수 만들기
def get_day_list(item_code, page_no):
"""
 일자별 시세를 페이지별로 수집
 """
url = f"https://finance.naver.com/item/sise_day.nhn?code={item_code}&page={page_no}"

headers = {'user-agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.96 Safari/537.36'}

response = requests.get(url, headers=headers)
html = bs(response.text, "lxml")
table = html.select("table")
table = pd.read_html(str(table))
df_day = table[0].dropna()
return df_day
수업 자료 파일에 해당 내용을 업데이트 해두었습니다.
colab을 다시 열어보시면 변경된 내용으로 실습을 해보실 수 있습니다.

소리가 겹쳐서 들려요

2026-04-27T14:32:22.191Z

데스크톱과 노트북 연결

2026-04-27T12:56:28.677Z

dict, zip

2026-04-27T03:02:13.509Z

노션 : 파트3번 링크와 권한 , 파트4번 권한요청, 파트 5번도 미리 요청 드립니다.

2026-04-26T14:40:12.944Z

6-6 실습 문의

2026-04-26T14:20:34.233Z

미션 06-02

2026-04-26T06:54:22.242Z

yes24 수집 md 파일 만들 때

2026-04-26T02:32:18.220Z

python main.py 실행시 게임이 실행이 안돼요

2026-04-25T10:21:21.984Z

antigravity 대신 cursor를 활용해도 되나요?

2026-04-25T07:37:41.149Z

뉴스 검색 분류 한도초과

2026-04-25T04:34:09.715Z

완성자료

2026-04-25T01:22:32.210Z

섹션5 노션링크 는 따로 없나요?

2026-04-24T17:30:37.995Z

필기자료 사라졌나요?(실기 일주일만에 안돼서 재도전-_-)

2026-04-24T08:08:36.076Z

Part 4에서 강의 연관 노션 정보들이 워드파일에 없습니다.

2026-04-24T07:16:20.552Z

첨부자료 Part 4 코드 확인 부탁드리겠습니다.

2026-04-24T06:27:31.554Z

Free Edition 실습 영상은 아직 업데이트전인가요?

2026-04-24T04:47:10.200Z

질문 드립니다.

2026-04-22T13:37:52.468Z

노션 링크

2026-04-21T12:48:13.445Z

26년 1회 실기 해설 강의

2026-04-21T11:09:43.289Z

노션 권한요청하였습니다 언제쯤 볼수있나요

2026-04-21T10:05:17.007Z

AAFM CWM_LEVEL_2 Exam Questions 2026: Right Preparation Method

2026-04-21T09:45:51.571Z

강의 내용 관련 질문드립니다~

2026-04-21T07:40:25.222Z

퍼플렉시티 최소 결제단위 50달러로 바뀐 것 같습니다.

2026-04-21T06:06:53.468Z

구글 Collab 접속 불가능

2021-02-23T01:51:16.837Z

387