pd.read_html(url) 관련 질문
257
작성한 질문수 6
이렇게 pandas로 html 문서를 읽어올 경우, html 문서에는 table 헤더 말고도 다양한 헤더들이 있을텐데 어떻게 자동으로 table 헤더 부분만 가져오는 건가요? 파이썬이 아니라 pandas로 불러왔기 때문에 데이터프레임 형태의 문서 일부분만 가져오는 건가요?
답변 1
0
안녕하세요.
해당 기능은 html 문서 내에서 table 태그만을 가져옵니다.
그래서 table 태그 외에 데이터를 수집하려면 웹스크래핑(크롤링)에 대한 다른 방법으로 데이터를 가져와야 합니다.
판다스에서 table 태그만을 가져오기 위해 만들어진 기능이라고 보면 됩니다.
cufflinks 버전문제로 iplot() 미실행
0
41
2
[수정요청]직접 수집한 주가 데이터로 시각화해보기
0
51
2
pd.read_html(url, encoding='cp949') 에러
0
75
2
fdr.StockListing('KRX') 문제 발생
0
135
2
주식 자동매매 프로그램 제작 관련 조언 부탁드립니다
0
429
1
concat 을 통한 데이터 프레임 합치기 에러 문의
0
104
2
한글폰트 관련해서 문의드립니다.
0
230
2
데이터프레임 칼럼명 문의 드립니다.
0
239
3
금융데이터 수집의 모든것
0
145
2
녹화시점과 현재시점 컬럼명이 변경이 많이 되었을까요?
0
191
2
파이썬 증권 데이터 수집과 분석으로 신호와 소음 찾기 - 섹션1 [2/2]
0
173
1
Mac 환경에서 nbextensions 활성화 하는 방법
0
594
2
pd.concat(result.tolist()) 오류 문의
0
243
1
5.1 제약 데이터 수집 오류 해결
0
231
1
Table of contents 문의드립니다
0
209
2
concat을 통한 데이터프레임 합치기
0
548
2
Reindexing only valid with uniquely valued Index objects 오류 질문입니다.
0
491
1
데이터 비교시 데이터 불일치
0
410
1
dtype={"itemcode": np.object}) 을 dtype={"itemcode": object}) 으로 변경해야 하나요?
0
593
1
질문 : for문 풀어쓰기
0
488
1
파이참에서 Plotly 그래프 실행방법
0
1308
1
5.1 데이터프레임 병합(merge)
0
741
2
쥬피터노트북에서 실행파일 만들기
0
1449
1
주피터노트북 확장팩 설치가 안됩니다.
0
561
2





