inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

실습으로 끝장내는 웹 크롤링과 웹 페이지 자동화 & 실전 활용

무비차트 모든 영화의 예매율, 개봉 날짜등 기타 정보 모두 가져오기

무비차트 모든 영화의 예매율, 개봉 날짜등 기타 정보 모두 가져오기 과정 중 질문입니다.

423

최형진

작성한 질문수 2

0

from bs4 import BeautifulSoup
import requests

url = "http://www.cgv.co.kr/movies/?lt=1&ft=0"
headers = {
    "User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.114 Safari/537.36"
}

r = requests.get(url, headers=headers).text
soup = BeautifulSoup(r, "html.parser")

charts = soup.select("div.sect-movie-chart > ol > li")
print(len(charts)) # Output : 20 ??

for chart in charts:
    title = chart.select_one("strong.title").text
    percent = chart.select_one("strong.percent").get_text
    print(title)
    print(percent(" : "))

무비차트 페이지에 보여지는 갯수도 19개고, 개발자 도구에서 li를 세어봐도 19개인데

len()으로 보면 20개가 나오고, for 문으로 코드를 실행시키면 19번째까지 제목과 예매율 출력하고 20번째에서 에러 문구가 발생합니다.

어떤 부분을 찾아보면 될까요?

python 웹-크롤링 beautifulsoup

답변 2

1

김플

영상에서의

sect_movie_chart = soup.select_one(".sect-movie-chart")

movie_chart = sect_movie_chart.select("li")

이 코드와

변경하신

charts = soup.select("div.sect-movie-chart > ol > li")

이 코드는 찾는게 다릅니다.

영상에서의 코드는 .sect-movie-chart를 한개만 찾아서 거기안에 있는 li를 찾죠.

하지만 변경하신 코드는 모든 .sect-movie-chart를 찾습니다. 확인 해보시면 화면에 .sect-movie-chart는 2개 존재합니다.

그렇기때문에 갯수를 확인했을때 차이가 생기게 됩니다.

0

최형진

저녁에 다시 한 번 해보겠습니다! 답글 감사합니다!

0

김플

강의를 보고 코드를 변경하신건가요?

0

최형진

안녕하세요!! 여러가지 방법으로 해보라고 하셔서 화면 멈춰놓고 이것저것 해보면서 따라하고 있는데

저 부분은 화면을 영상에 있는 코드를 따라해도 길이 결과가 자꾸 20개로 나옵니다..

멜론 사이트 수집부터 안됩니다

0

62

1

강의 시점이랑 현재랑 네이버 사이트 변화가 많은거 같아서 질문드립니다.

0

58

1

-href 가져오기

0

91

2

수업내용 프로젝트의 완성된 코드는 제공이 안돼나요?

0

157

1

안녕하세요 쿠팡 크롤링 막힌거 같아요 3번돌리니깐 막았어요 해결방법없을까요?

0

3650

1

쿠팡 BeautifullSoup 헤더넣어도 막히네요

0

443

1

네이버 쇼핑 크롤링 1 코드 사용 시, 접속 제한됐을 때의 해결 방법이 궁금합니다.

0

3184

1

추가 강의 업데이트 있나요?

0

246

1

lambda 중에 문의가 있습니다.

0

269

1

텔레그램 sendMessage 시 400에러가 뜹니다.

0

905

2

ftp 로긴 문제입니다. ㅜ

0

410

2

네이버 쇼핑 크롤링 질문입니다.

0

369

1

XPATH 네이버에서 카페 찾는 과정 문의입니다.

1

313

1

셀레니움 By.XPATH 를 이용한 키워드 입력 작성 질문입니다.

0

671

2

쿠팡 이미지 파일 다운받기에서 동일하게 코드 작성 후 요청하였지만 파일 다운로드가 안됩니다.

0

814

2

파이썬에 키워드를 치는게 아닌...

0

276

2

50프로 수강중입니다~

0

220

1

제품 링크를 타고 들어가야 원하는 정보가 나오는 사이트

0

385

2

lst = lst50 + lst100 이거 대신에

0

323

2

증권, 메일 등 서비스 목록을 못가져와요 ㅠㅠ

1

286

1

네이버에 view탭이 업데이트가 됐는지 없어졌네요... ㅠㅠ

1

245

1

선생님이랑 똑같이 적었는데 저는 왜 오류가 날까요?ㅠ

0

355

2

네이버쇼핑 크롤링 문의

0

430

2

asyncio.run() cannot be called from a running event loop 에러 질문 드립니다

0

3906

4