inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

파이썬 증권 데이터 수집과 분석으로 신호와 소음 찾기

[2/8] 크롬브라우저를 통한 수집하고자 하는 데이터 확인하기

pd.read_html(url, encoding='cp949') 에러

75

lee sangyoun

작성한 질문수 5

0

url = "https://finance.naver.com/item/sise.nhn?code=352820"
pd.read_html(url, encoding='cp949')

AttributeError: 'SoupStrainer' object has no attribute 'name'

상기와 같이 코드 실행시 에러가 발생합니다..

원인을 알려주십시요

python pandas numpy 웹-크롤링 seaborn plotly matplotlib 웹-스크래핑

답변 2

1

lee sangyoun

beautifulsoup와 pandas 간의 버젼 문제입니다.
chatgpt에게 답을 얻었고,

beautifulsoup의 아래와 같은 버전 설치로

해결했습니다.

pip install beautifulsoup4==4.12.3

0

박조은

안녕하세요. 지식공유자 입니다.

이용에 불편을 드려 죄송합니다.

해결 되었다니 다행입니다.

감사합니다 🙏

0

인프런 AI 인턴

안녕하세요, 인프런 AI 인턴입니다. lee sangyoun님.

pd.read_html(url, encoding='cp949')을 사용할 때 발생하는 에러에 대해 질문 주셨습니다. 해당 오류 메시지인 AttributeError: 'SoupStrainer' object has no attribute 'name'pandas 버전과 beautifulsoup4의 특정 버전 간의 호환성 문제로 인해 발생할 수 있습니다.

pd.read_html 함수는 기본적으로 beautifulsoup4를 사용하여 HTML 문서 내 테이블을 검색합니다. 그러나 beautifulsoup4의 특정 버전에서는 SoupStrainer 객체와 관련된 오류가 발생할 수 있습니다. 이를 해결하기 위해 아래의 조치를 고려해보세요.

  1. 패키지 업데이트:

    • 최신 버전의 pandasbeautifulsoup4로 업데이트하면 문제가 해결될 수 있습니다. 다음 명령어를 사용하여 패키지를 업데이트해보세요.
      
      pip install --upgrade pandas beautifulsoup4
      

  2. 알맞은 인코딩 확인:

    • cp949 대신 utf-8을 시도해볼 수 있습니다. 인코딩 문제는 데이터 불러오기에 영향을 줄 수 있어 시도해 볼 가치가 있습니다.
      
      pd.read_html(url, encoding='utf-8')
      

  3. 대체 라이브러리 사용:

    • html5lib 등의 다른 파서를 사용하는 것도 방법입니다.
      
      pd.read_html(url, flavor='html5lib', encoding='cp949')
      

관련하여 도움이 될 수 있는 유사한 질문들을 아래에서 확인할 수 있습니다.
- pd.read_html(url) 관련 질문
- 업종 테마 데이터 수집시 판다스 read_html에러

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

cufflinks 버전문제로 iplot() 미실행

0

41

2

[수정요청]직접 수집한 주가 데이터로 시각화해보기

0

51

2

fdr.StockListing('KRX') 문제 발생

0

135

2

주식 자동매매 프로그램 제작 관련 조언 부탁드립니다

0

429

1

concat 을 통한 데이터 프레임 합치기 에러 문의

0

104

2

한글폰트 관련해서 문의드립니다.

0

230

2

데이터프레임 칼럼명 문의 드립니다.

0

239

3

금융데이터 수집의 모든것

0

145

2

녹화시점과 현재시점 컬럼명이 변경이 많이 되었을까요?

0

191

2

파이썬 증권 데이터 수집과 분석으로 신호와 소음 찾기 - 섹션1 [2/2]

0

173

1

Mac 환경에서 nbextensions 활성화 하는 방법

0

594

2

pd.concat(result.tolist()) 오류 문의

0

243

1

5.1 제약 데이터 수집 오류 해결

0

231

1

Table of contents 문의드립니다

0

209

2

concat을 통한 데이터프레임 합치기

0

548

2

Reindexing only valid with uniquely valued Index objects 오류 질문입니다.

0

491

1

데이터 비교시 데이터 불일치

0

410

1

dtype={"itemcode": np.object}) 을 dtype={"itemcode": object}) 으로 변경해야 하나요?

0

593

1

질문 : for문 풀어쓰기

0

488

1

파이참에서 Plotly 그래프 실행방법

0

1308

1

5.1 데이터프레임 병합(merge)

0

740

2

쥬피터노트북에서 실행파일 만들기

0

1449

1

주피터노트북 확장팩 설치가 안됩니다.

0

561

2

날짜 정보

0

386

1