실전 크롤링 기술팁2 >추출한 데이터 내 추출하기 질문 드립니다
401
작성한 질문수 3
선생님 안녕하세요, 강의 매번 잘 듣고 있습니다. 크롤링 복습 중 질문이 있어 아래와 같이 문의 드립니다 :)
강의명: 실전크롤링과 강력한 크롤링 기술 팁2
강의 내 시간: 4:35
질문: 하단의 초록색 부분만 추출할 때 저는 아래 첫번째샷으로 짜서 >>print(mydata.get_text() 결과값이 선생님이 하신 것과 동일한 결과가 나왔는데요, 선생님께서는 두번째 샷으로 설명해주셨는데, 다시 titles=mydata.find_all('li','course')를 받아서 출력을 해야 하는 건지 궁금합니다. 이미 id='dev_course_list로 상위 id에서 확정을 하고 들어가서 'li','course' 부분을 작성하지 않아도 된다고 생각했습니다.
import requests
from bs4 import BeautifulSoup
res=requests.get('https://davelee-fun.github.io/blog/crawl_test')
soup=BeautifulSoup(res.content,'html.parser')
mydata=soup.find('ul',id='dev_course_list')
print(mydata.get_text())import requests
from bs4 import BeautifulSoup
res=requests.get('https://davelee-fun.github.io/blog/crawl_test')
soup=BeautifulSoup(res.content,'html.parser')
mydata=soup.find('ul',id='dev_course_list')
titles=mydata.find_all('li','course')
for title in titles:
print(title.get_text())
답변 1
0
안녕하세요. 답변 도우미입니다.
두 코드 모두 초록색 부분을 추출하는 것은 동일하며, 두 번째 코드는 각각의 'li' 태그를 따로 추출하여 처리할 수 있는 구조입니다. 결과적으로 두 코드 모두 동일한 출력을 얻을 수 있습니다.
첫 번째 코드는 'ul' 태그에서 모든 텍스트를 한 번에 추출하므로, 구조를 유지하지 않고 텍스트만 얻을 수 있습니다. 다만, 두 번째 코드는 각각의 'li' 태그를 찾아 처리하므로, 필요한 경우 추가 작업을 수행할 수 있습니다.
예를 들어, 'li' 태그 중 특정 조건에 맞는 태그만 출력하거나 처리하려면 두 번째 코드 방식이 더 유용합니다. 그러나 초록색 부분만 가져오는 것이라면, 둘다 상관없습니다.
감사합니다.
65강 소리
0
23
1
섹션 5 CSS selector사용해서 클로링하기2의 커리큘럼 일정 부재?
0
23
2
크롤링, 영상을 따라해도 제미나에게 물어봐도 안되요
0
38
1
정규표현식 및 여러 코드 꼭 외워야 하나요?
0
44
1
리스트 함수형도 정수 데이터 받을 수 있나요?
0
50
1
크롤링 관련 질문
0
69
1
문제 답이 없는 버전은 없나요?
0
80
1
requests, BeautifulSoup 임포트 부분에 대해 문의드립니다.
0
89
1
업데이트 강의
0
105
2
선생님 강의중에서 sqlite3 강의를 제공한 강의가 있나요?
0
128
2
연습용 예제 파일
0
79
1
lxml 관련 오류
0
111
1
SAVE Request 창 띄우는 법
0
96
1
포스트맨 사용법이 바뀌어서 강의를 따라가지 못하겠습니다. 2
0
81
1
포스트맨 사용법이 바뀌어서 강의를 따라가지 못하겠습니다.
0
102
1
예제 2, 4, 6에 대한 풀이 방식 질문.
0
93
1
문제 파일
0
83
1
pdf 파일 내 코드 복붙시 공백
0
297
1
데이터 저장 강좌 문의 건
0
100
1
" " 와 ' '의 차이를 알고 싶습니다
0
247
1
Exercise 22. 문자열 다루기 (strip)
0
140
1
list함수로 리스트 선언하면 실패하는데 이유는 무엇입니까?
0
193
1
셀 삽입후 바로 기입이 가능합니까?
0
143
2
주피터 노트북 마우스 스크롤? 오류
0
1562
2





