• 카테고리

    질문 & 답변
  • 세부 분야

    데이터 분석

  • 해결 여부

    미해결

크롤링 하는데 자꾸 오류가 떠요

22.09.19 00:22 작성 조회수 191

0

import requests

from bs4 import BeautifulSoup

res = requests.get("https://n.news.naver.com/mnews/article/215/0001054638?sid=101")

soup = BeautifulSoup(res.content, "html.parser")

mydata = soup.find("h2", "media_end_head_headline")

mydata.get_text()

코드는 영상에 나온 그대로 따라 했는데 자꾸 오류가 떠요. 오류는 'NoneType' object has no attribute 'get_text' 이렇게 뜨는데 오류가 왜 뜨는건가요??

답변 2

·

답변을 작성해보세요.

0

jade.hwang@kt.com님의 프로필

jade.hwang@kt.com

2023.02.12

학습자로서 질문하신 부분을 저도 한번 실행해 보았는데요.

'이번주 뉴욕증시, 9월 FOMC 결과에 관심 집중'라는 텍스트를 크롤링 하시려고 한 것이라면 아래와 같이 한 줄만 코드를 변경하시면 될 것 같습니다.

mydata = soup.find('div', 'media_end_head_title')

해당 텍스트를 감싸고 있는 코드의 태그를 잘 보셔야 해요 ^^

저도 유심히 들여다보니 보이더라구요! 파이팅 하세요~!!

0

안녕하세요. 답변도우미입니다.

영상을 확인해봤는데요. 영상이 패턴으로 실습하며 익히기: HTML/CSS 이해를 바탕으로 크롤링하기 맞는 것이지요? 해당 영상에서는 특정 daum.net 사이트 주소를 기반으로 보여드리고 있는데요.

보여주신 코드는 naver 사이트이신 것 같아서요. 영상과 동일한 코드가 맞는지요? 사이트마다 당연히 코드가 다 다르게 작성을해야 하거든요. 심지어 실제 사이트는 수시로 달라지기 때문에, 다른 사이트를 크롤링 하는 코드는 본 강의를 끝까지 들으셔서, 어느 정도 여러가지 케이스를 이해하신 후에, 조금씩 연습해보시는 것이 좋습니다.

혹시 강의에서 보여드린 코드와 완전히 동일한데, 저희가 착각한 것이라면, 괜찮으시다면, dream@fun-coding.org 로 다시 해당 챕터와 영상 시간을 보내주시면 바로 또 확인해보겠습니다.

감사합니다.