실전 크롤링 기술팁2 >추출한 데이터 내 추출하기 질문 드립니다
402
작성한 질문수 3
선생님 안녕하세요, 강의 매번 잘 듣고 있습니다. 크롤링 복습 중 질문이 있어 아래와 같이 문의 드립니다 :)
강의명: 실전크롤링과 강력한 크롤링 기술 팁2
강의 내 시간: 4:35
질문: 하단의 초록색 부분만 추출할 때 저는 아래 첫번째샷으로 짜서 >>print(mydata.get_text() 결과값이 선생님이 하신 것과 동일한 결과가 나왔는데요, 선생님께서는 두번째 샷으로 설명해주셨는데, 다시 titles=mydata.find_all('li','course')를 받아서 출력을 해야 하는 건지 궁금합니다. 이미 id='dev_course_list로 상위 id에서 확정을 하고 들어가서 'li','course' 부분을 작성하지 않아도 된다고 생각했습니다.
import requests
from bs4 import BeautifulSoup
res=requests.get('https://davelee-fun.github.io/blog/crawl_test')
soup=BeautifulSoup(res.content,'html.parser')
mydata=soup.find('ul',id='dev_course_list')
print(mydata.get_text())import requests
from bs4 import BeautifulSoup
res=requests.get('https://davelee-fun.github.io/blog/crawl_test')
soup=BeautifulSoup(res.content,'html.parser')
mydata=soup.find('ul',id='dev_course_list')
titles=mydata.find_all('li','course')
for title in titles:
print(title.get_text())
답변 1
0
안녕하세요. 답변 도우미입니다.
두 코드 모두 초록색 부분을 추출하는 것은 동일하며, 두 번째 코드는 각각의 'li' 태그를 따로 추출하여 처리할 수 있는 구조입니다. 결과적으로 두 코드 모두 동일한 출력을 얻을 수 있습니다.
첫 번째 코드는 'ul' 태그에서 모든 텍스트를 한 번에 추출하므로, 구조를 유지하지 않고 텍스트만 얻을 수 있습니다. 다만, 두 번째 코드는 각각의 'li' 태그를 찾아 처리하므로, 필요한 경우 추가 작업을 수행할 수 있습니다.
예를 들어, 'li' 태그 중 특정 조건에 맞는 태그만 출력하거나 처리하려면 두 번째 코드 방식이 더 유용합니다. 그러나 초록색 부분만 가져오는 것이라면, 둘다 상관없습니다.
감사합니다.
33강 9:51 excercise55.
0
26
1
섹션2 - 32강 연습문제 48번 질문
0
31
0
주피터 노트북 사용법 강의 관련
0
33
1
exercise 20. 데이터 구조(리스트)
0
34
0
65강 소리
0
40
1
섹션 5 CSS selector사용해서 클로링하기2의 커리큘럼 일정 부재?
0
51
2
크롤링, 영상을 따라해도 제미나에게 물어봐도 안되요
0
57
1
정규표현식 및 여러 코드 꼭 외워야 하나요?
0
61
1
리스트 함수형도 정수 데이터 받을 수 있나요?
0
68
1
크롤링 관련 질문
0
77
1
문제 답이 없는 버전은 없나요?
0
92
1
requests, BeautifulSoup 임포트 부분에 대해 문의드립니다.
0
100
1
업데이트 강의
0
122
2
선생님 강의중에서 sqlite3 강의를 제공한 강의가 있나요?
0
154
2
연습용 예제 파일
0
90
1
lxml 관련 오류
0
119
1
SAVE Request 창 띄우는 법
0
110
1
포스트맨 사용법이 바뀌어서 강의를 따라가지 못하겠습니다. 2
0
92
1
포스트맨 사용법이 바뀌어서 강의를 따라가지 못하겠습니다.
0
118
1
예제 2, 4, 6에 대한 풀이 방식 질문.
0
108
1
문제 파일
0
94
1
pdf 파일 내 코드 복붙시 공백
0
319
1
데이터 저장 강좌 문의 건
0
109
1
" " 와 ' '의 차이를 알고 싶습니다
0
274
1





