inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

웹스크래핑 코드 리뷰 도와주세요 (초렙.. '-')

476

김하린

작성한 질문수 1

0

네이버웹툰 만화 -> 신혼일기 -> 15화 제목을 가져와 보려고 하기와 같이 코드를 작성했습니다만

주피터 노트북에서 run 했을 때 [ ] 라고만 나옵니다 ㅠㅠ 어떻게 해야 할까요??

import requests

from bs4 import BeautifulSoup as bs

url = "https://comic.naver.com/webtoon/list?titleId=812354"

rsp = requests.get(url, verify=False) rsp.raise_for_status()

soup = bs(rsp.text, "lxml")

print(soup.find_all("span", attrs={"class": "EpisodeListList__title--lfIzU"}))

python requests scraping

답변 1

0

인프런 AI 인턴

안녕하세요, 인프런 AI 인턴입니다.

해당 코드를 보면 몇 가지 문제가 있어 보입니다.

  1. from bs4 import BeautifulSoup as bs 부분에서 as bs를 사용하고 계신데, 나중에 BeautifulSoup을 사용할 때 bs 대신 soup로 사용하고 계셔야 합니다. 따라서 as bs 부분을 삭제하고 soup라는 변수명을 사용하시는 것이 좋습니다.

  2. requests.get(url, verify=False)에서 verify=False를 사용하고 계시는데, 이는 SSL 인증을 건너뛰는 것입니다. 대부분의 경우 필요하지 않기 때문에 이 부분을 제거하시는 것이 좋습니다.

  3. print(soup.find_all("span", attrs={"class": "EpisodeListList__title--lfIzU"}))에서는 find_all을 사용하여 span 태그 중 클래스 이름이 EpisodeListList__title--lfIzU인 요소들을 모두 찾는 것입니다. 그러나 해당 요소들은 모두 상위 요소인 div로 감싸져 있습니다. 따라서 div 태그를 추가하고, 그 안에서 span 태그를 찾도록 코드를 수정하셔야 합니다.

수정한 코드는 아래와 같습니다.

import requests
from bs4 import BeautifulSoup as soup

url = "https://comic.naver.com/webtoon/list?titleId=812354"
rsp = requests.get(url)
rsp.raise_for_status()
html = rsp.text

soup = soup(html, "lxml")
episodes = soup.find_all("div", attrs={"class": "col_inner"})[0].find_all("span", attrs={"class": "title"})

for episode in episodes:
    print(episode.text)

위의 코드는 네이버 웹툰의 신혼일기 중 제목(class=“title”)을 가져와 출력하는 코드입니다. 코드를 실행하면 해당되는 제목들이 출력될 것입니다.

참고로, 코드 실행 결과가 []로 나오는 경우에는 해당 요소들을 찾지 못한 것입니다. 그 경우에는 요소의 선택자나 클래스 이름 등을 확인해보시고, 코드를 적절히 수정하셔야 합니다.

기능에 대한 추가적인 도움이 필요하신 경우, 더 상세한 질문을 주시면 더 많은 도움을 드릴 수 있을 것입니다. 감사합니다.

강의 내용 실습관

0

7

0

노션 파일 없음

0

12

3

한국투자 증권

0

17

2

52번 강의 질문입니다.

0

12

2

https://youtu.be/ziTLbsE9Cbc 유튜브 노션 링크 권한 부탁드립니다.

0

13

2

Breadth (등락 비율) 분석

0

17

1

교육자료가 너무 오래되어서 지시한대로 진행하려 해도 안됩니다.

0

12

1

작업형1 - 연습문제 16~39 풀이는 몇강을 보면 되나요?

0

23

1

26 .강의 프롬프트와 프롬프트파일(part3) 내용이 차이가 있어요.

0

23

2

작업형 1 -연습문제 4-6

0

21

1

구글 그래피티 마켓 오류...?!

0

29

2

디스코드 소통창구는 없어졌나요 ??

0

36

2

FOREIGN KEY 정리하기, 영상대로 SQL코드 복붙해도 안되요.

0

19

1

모델 서빙과 관련된 강좌 출시 예정된 바가 있으신지 여쭤봅니다!

0

24

2

모델 서빙과 관련된 강좌가 출시되는지 질문드립니다.

0

19

2

20번강좌에 대한 질문입니다.

0

27

2

6-6

0

29

1

작업형 1 유형 부분

0

31

2

수강평 이벤트

0

26

2

작업형 1 (삭제예정, 구 버전)

0

46

2

강의노트는 어디있나요?

0

22

1

노션 학습 자료 권한 요청

0

28

2

수강기간 연장 문의드립니다.

0

31

1

2유형 레이블 인코딩 VS 원핫 인코딩

0

35

3