inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

웹스크래핑 코드 리뷰 도와주세요 (초렙.. '-')

477

김하린

작성한 질문수 1

0

네이버웹툰 만화 -> 신혼일기 -> 15화 제목을 가져와 보려고 하기와 같이 코드를 작성했습니다만

주피터 노트북에서 run 했을 때 [ ] 라고만 나옵니다 ㅠㅠ 어떻게 해야 할까요??

import requests

from bs4 import BeautifulSoup as bs

url = "https://comic.naver.com/webtoon/list?titleId=812354"

rsp = requests.get(url, verify=False) rsp.raise_for_status()

soup = bs(rsp.text, "lxml")

print(soup.find_all("span", attrs={"class": "EpisodeListList__title--lfIzU"}))

python requests scraping

답변 1

0

인프런 AI 인턴

안녕하세요, 인프런 AI 인턴입니다.

해당 코드를 보면 몇 가지 문제가 있어 보입니다.

  1. from bs4 import BeautifulSoup as bs 부분에서 as bs를 사용하고 계신데, 나중에 BeautifulSoup을 사용할 때 bs 대신 soup로 사용하고 계셔야 합니다. 따라서 as bs 부분을 삭제하고 soup라는 변수명을 사용하시는 것이 좋습니다.

  2. requests.get(url, verify=False)에서 verify=False를 사용하고 계시는데, 이는 SSL 인증을 건너뛰는 것입니다. 대부분의 경우 필요하지 않기 때문에 이 부분을 제거하시는 것이 좋습니다.

  3. print(soup.find_all("span", attrs={"class": "EpisodeListList__title--lfIzU"}))에서는 find_all을 사용하여 span 태그 중 클래스 이름이 EpisodeListList__title--lfIzU인 요소들을 모두 찾는 것입니다. 그러나 해당 요소들은 모두 상위 요소인 div로 감싸져 있습니다. 따라서 div 태그를 추가하고, 그 안에서 span 태그를 찾도록 코드를 수정하셔야 합니다.

수정한 코드는 아래와 같습니다.

import requests
from bs4 import BeautifulSoup as soup

url = "https://comic.naver.com/webtoon/list?titleId=812354"
rsp = requests.get(url)
rsp.raise_for_status()
html = rsp.text

soup = soup(html, "lxml")
episodes = soup.find_all("div", attrs={"class": "col_inner"})[0].find_all("span", attrs={"class": "title"})

for episode in episodes:
    print(episode.text)

위의 코드는 네이버 웹툰의 신혼일기 중 제목(class=“title”)을 가져와 출력하는 코드입니다. 코드를 실행하면 해당되는 제목들이 출력될 것입니다.

참고로, 코드 실행 결과가 []로 나오는 경우에는 해당 요소들을 찾지 못한 것입니다. 그 경우에는 요소의 선택자나 클래스 이름 등을 확인해보시고, 코드를 적절히 수정하셔야 합니다.

기능에 대한 추가적인 도움이 필요하신 경우, 더 상세한 질문을 주시면 더 많은 도움을 드릴 수 있을 것입니다. 감사합니다.

8분54초 테이블 내용 문의

0

7

0

코딩팡 장업형2 베이스 라인 인코딩 종류 질문

0

14

2

multi_tool_agent.py 에서 arxiv tool 에러

0

13

1

로지스틱회귀, 회귀

0

36

2

가상 환경과 차이 도커 질문

0

18

1

자료 다운로드 위치 확인 부탁드립니다.

0

9

1

회귀 문제를 풀때 질문입니다.

0

34

1

불균형 처리 후 성능이 더 낮아졌다면,

0

48

2

실기 체험 제2유형 에러 문의

0

40

1

LIGHTGBM 으로 하면 pred값이 소수점 6자리까지 나오는게 맞나요

0

36

2

안녕하세요

1

18

3

3번문제 등분산 가정

0

36

2

작업형3 target 형 변환 질문

0

30

2

[작업형1] 연습문제 섹션1 ~ 10 의 section4

0

24

3

원핫인코딩과 레이블 인코딩에서 concat

0

47

2

agent 평가 관련 문의 드립니다.

0

16

1

제2유형 질문입니다.

0

40

2

WSL에서 Airflow 실행 시 로컬 venv 라이브러리 사용 여부 및 관리 방법

0

16

2

C()

0

36

2

작업형 2에서 strafity 적용 유무

0

46

2

수강 기간 연장 가능 여부 문의드립니다.

0

48

1

ols

0

38

2

2유형 작성관련 질문(일반 심화)

0

32

2

2유형 작성관련 질문

0

30

2