Mã Watch Me: Phân tích dữ liệu Python cho Joorin

Thu thập các cổ phiếu riêng lẻ: Thu thập dữ liệu giá cổ phiếu bằng các hàm tích hợp FinanceDataReader và Pandas

pd.read_html(url) 시 에러가 납니다

2021-02-14T07:01:49.505Z

5570

moolive

7 câu hỏi đã được viết

아래와 같이 코드 실행 시 에러가 납니다

pd.read_html(url) 부분입니다

ValueError                                Traceback (most recent call last)
<ipython-input-28-5d8f83db45ac> in <module>()
----> 1 pd.read_html(url)

5 frames
/usr/local/lib/python3.6/dist-packages/pandas/io/html.py in _parse_tables(self, doc, match, attrs)
    545 
    546         if not tables:
--> 547             raise ValueError("No tables found")
    548 
    549         result = []

python pandas numpy

Câu trả lời 1

sungeun6kim1465

2021-03-02T09:00:51.448Z

판다스 내장함수인 read_html의 경우, 읽어올 html 문서 내에 <table> 태그가 있어야 수집이 가능합니다.

위에서 설정하신 url 변수를 참조하시어, 마우스 우클릭 > 검사 (혹은 Inspect)를 눌렀을 때 <table>태그가 나오는 지 확인해보시기 바랍니다 =)

moolive

2021-03-05T11:20:00.736Z

table 코드가 있는데도 그렇습니다.

sungeun6kim1465

2021-03-17T01:11:01.483Z

학습자님, 강의 원작자인 박조은 강사님께 해당 사항을 문의드려

관련 오류를 해결 / 강의 자료에 반영 완료하였습니다.

라이브 강의 이후 네이버 일별 시세 페이지가 변경이 되어 일부 오류가 발생한 것으로 보입니다.

학습에 지장을 드려 정말 죄송합니다.

라이브 강의 이후 변경사항

네이버 증권 일별 시세의 웹페이지가 변경되어 기존의 방법으로는 불러올 수 없습니다.
일별 시세 페이지에서 브라우저가 아닐 때 응답을 하지 않기 때문인데 이 때 requests 라는 라이브러리를 통해 HTTP 요청을 보내고 웹사이트의 소스코드를 받아와서 table 태그를 찾는 방법으로 받아올 수 있습니다.
아래의 코드를 보면 requests를 통해 HTTP 통신을 보내고 beautifulsoup을 통해 HTML 페이지 내에서 table 태그를 찾습니다.
table 태그를 read_html로 불러오면 판다스의 데이터프레임으로 읽어올 수 있습니다.

requests를 통한 HTTP 요청

# 일별 시세 페이지를 읽어 올 때 브라우저가 아니면 응답을 하지 않기 때문에 브라우저 인 것 처럼 요청을 보냅니다.
# 응답으로 HTML 페이지 전체를 받아옵니다.
import requests

headers = {'user-agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.96 Safari/537.36'}

response = requests.get(url, headers=headers)

BeautifulSoup 을 통한 table 태그 찾기

# BeautifulSoup 을 통해 html 페이지 내의 table 태그를 찾습니다.
from bs4 import BeautifulSoup as bs

html = bs(response.text, "lxml")
html_table = html.select("table")
len(html_table)

# html에서 찾은 table 태그를 pandas 로 읽어옵니다.
table = pd.read_html(str(html_table))
table[0].dropna()

페이지별 데이터 수집 함수 만들기
def get_day_list(item_code, page_no):
"""
 일자별 시세를 페이지별로 수집
 """
url = f"https://finance.naver.com/item/sise_day.nhn?code={item_code}&page={page_no}"

headers = {'user-agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.96 Safari/537.36'}

response = requests.get(url, headers=headers)
html = bs(response.text, "lxml")
table = html.select("table")
table = pd.read_html(str(table))
df_day = table[0].dropna()
return df_day
수업 자료 파일에 해당 내용을 업데이트 해두었습니다.
colab을 다시 열어보시면 변경된 내용으로 실습을 해보실 수 있습니다.

supabase_key 관련

2026-07-27T08:01:18.090Z

프롬프트의 영문 버전을 만들 때, 출력 규칙에 포함된 한글 부분은 영어로 번역하지 않고 그대로 유지하면서, 영문 편과 한글 편을 한 번에 함께 출력하려면 어떤 워크플로우로 구성하면 좋을까요?

2026-07-26T05:20:46.578Z

프로그램은 뭘 사용하시는 건가요??

2026-07-26T02:56:02.771Z

수업자료와 노션 공유 문제

2026-07-25T01:04:14.630Z

python run.py 실행시 에러 문제

2026-07-24T12:26:27.228Z

조건 반복문 질문: for 문 ?

2026-07-24T02:36:49.160Z

54강 4분 41초에서 질문 있어요.

2026-07-24T01:37:51.340Z

커서창

2026-07-23T14:23:10.972Z

강의 제작

2026-07-23T09:10:08.901Z

23강 질문드립니다, 강사님.

2026-07-23T09:06:15.117Z

import

2026-07-23T06:23:19.279Z

45강 예제4번에서 질문 있어요!

2026-07-23T01:07:29.083Z

45강 강의 10분 03초 내용에서 x + 1 을 하는 이유는 뭔가요?

2026-07-23T00:53:38.339Z

Json.stringify 관련 오류일까요?

2026-07-23T00:25:48.275Z

3강, 7강 화면이 안나옵니다. 그냥 검은화면으로만 노출되요;;

2026-07-22T13:27:01.955Z

cursor 환경

2026-07-22T12:27:57.655Z

Gradio 실행 시 에러 발생 문의

2026-07-22T11:44:03.057Z

Gradio 실행 시 Jinja2 / ASGI TypeError: unhashable type: 'dict' 에러 문의

2026-07-22T11:41:19.408Z

안녕하세요, 강의자료 요청드립니다

2026-07-22T08:53:15.584Z

개발 환경 준비와 프로젝트 구조 강의 관련

2026-07-22T08:38:48.280Z

자료실 문의합니다. AIDU 툴 다운받으려고합니다.

2026-07-22T04:41:41.045Z

수강연장요청 문의

2026-07-22T02:24:41.098Z

저장 공간

2026-07-21T13:51:41.801Z

구글 Collab 접속 불가능

2021-02-23T01:51:16.837Z

421