inflearn logo
강의

Course

Instructor

[New Revised Edition] This is Real Crawling - Practical Edition (AI Monetization)

유튜브 크롤링/키워드 별 크롤링 방법에서 에러발생합니다.

995

expert7kr1332

4 asked

1

div#metadata-line > span

위 그림에서 처럼 이것은 인식 합니다만

위 그림에서와 같이 div#metadata-line > span::nth-child(1) 은 인식 하지 못하는 것 같습니다.

info.find_elements(By.CSS_SELECTOR, "div#metadata-line span")[0]

selenium에서는 이렇게 해서 해결했습니다만...

views = info.select("div#metadata-line > span")[1].text

views = info.select("div#metadata-line  span")[1].text

BeautifulSoup에서는 위 코드도 오류가 발생합니다.

python 웹-크롤링 웹-크롤링

Answer 3

1

expert7kr1332

 

views = info.select_one("div#metadata-line > span:nth-of-type(1)").text
date = info.select_one("div#metadata-line > span:nth-of-type(2)").text

감사합니다. ^^

해보니 잘됩니다.

0

startcoding

nth-of-type이 직관적이어서 저는 요걸 자주 씁니다.

n 번째 있는 요소를 선택하고 싶을 때 아주 유용하죠

완강까지 화이팅입니다!

1

startcoding

div#metadata-line > span:nth-child(1) 대신에

div#metadata-line > span:nth-of-type(1)을 이용해 보세요

 

  • nth-child : 모든 자식의 순서에서 찾음

  • nth-of-type: 해당하는 자식 태그 요소에서의 순서를 찾음


0

expert7kr1332

# 조회수
views_date = info.select_one("div#metadata-line").text.split("•")[1].strip().replace("조회수 ", "")
views = "조회수 " + views_date.split("회")[0] + "회"

# 날짜
date = views_date.split("회")[1]

이렇게 해서 해결했습니다.

 

 

셀레니움 환경설정 오류

0

42

2

네이버 로그인 관련

0

234

2

안녕하세요 셀레니움에 대해서 질문

0

81

1

크롤링 연습사이트 문의

0

93

2

선택자 질문

0

71

2

'특정 요소가 나타날 때까지 스크롤' 부분 에러

0

76

2

자동 로그인 질문

0

84

2

44강 제목, 링크

0

99

1

원하는 값이 없을 때

0

88

2

크롤링한 링크가 엑셀로 들어가면 작동이 안되요

0

224

2

셀레니움 PDF자료는 받을 수 있나요

0

100

2

글목록 추출하기

0

96

2

메일 자동화 로그인 중복방지문자해결 오류 및 명시적 대기 질문

0

86

2

강의 노트가 어디에 있는건가요?

0

80

2

강의 커리큘럼 질문

0

95

1

조건문 else 사용하지 않는 이유

0

73

2

셀레니움으로 접근할 수 없는 경우

0

95

2

웹페이지 변경

0

70

2

자바스크립트로 태그 선택 시 질문입니다.

1

62

2

수료증은 어떻게 받나요?

0

116

2

class명을 활용하여 선택자를 만들지 않는 경우..?

0

59

2

드라이버가 안 열려요

0

78

2

이거 해결방법 아시는 분?

0

121

2

네이버 지식인 크롤링..

0

200

2