특정 텍스트가 포함되는 태그 여러개 찾기
131
작성한 질문수 1
안녕하세요, [텍스트를 포함하는 태그 찾기(정규표현식)] 강좌에서 특정 텍스트로 시작하는 태그 여러개 찾기와, 특정 텍스트로 끝나는 태그 여러개 찾기 실습을 하면서 궁금증이 생겨 질문 드립니다.
[for*="obb"]처럼 for 속성자 중에 obb가 포함되어 있는 것을 찾는 코드처럼
soup.find_all 명령어를 활용해서 제목 중간에 256GB가 적혀있는 태그를 여러개 찾으려면 *를 활용해서 어떻게 코드를 작성할 수 있는지 궁금합니다!
답변 1
0
안녕하세요, 인프런 AI 인턴입니다. 교육님 질문에 도움이 될 만한 자료를 찾아보았습니다.
태그 속성에서 특정 문자열을 포함한 요소들을 찾기 위해 BeautifulSoup의 find_all 메서드를 활용할 수 있습니다. 특히, 중간에 특정 텍스트가 포함된 태그들을 찾고자 할 땐 RegEx(정규 표현식)를 사용하여 좀 더 정교한 검색을 수행할 수 있습니다.
아래에 관련된 유사한 질문과 답변 링크를 몇 가지 공유드립니다:
select() class명 질문입니다. - 이 질문에서는 정규 표현식을 사용하여 정교하게 찾는 방법에 대해 설명하고 있습니다.
안녕하세요. G마켓에서 해당태그를 찾는데 너무 어렵습니다. - 이 질문에서는
select와 함께 CSS 선택자를 사용하여 특정 속성의 조건을 입력하는 방법을 소개하고 있습니다.궁금한 거 있어요 - 이 질문에서도 클래스를 두 개 이상 포함하는 태그를 찾는 방법에 대한 설명이 포함되어 있어 참고하시면 좋을 것 같습니다.
find_all을 사용할 때 정규 표현식을 포함할 수 있기 때문에 다음과 같이 사용할 수 있습니다:
import re
from bs4 import BeautifulSoup
# HTML 예제 코드
html_doc = """
<div for="1obbGBKe"></div>
<div for="2abc128GB"></div>
<div for="obb"></div>
<div for="3mno256GB"></div>
"""
soup = BeautifulSoup(html_doc, 'html.parser')
# 정규표현식을 이용하여 256GB가 포함된 태그 찾기
tags_with_256GB = soup.find_all(attrs={"for": re.compile("256GB")})
for tag in tags_with_256GB:
print(tag)
위와 같은 방식으로 find_all 함수에 정규표현식을 포함하여 특정 텍스트 패턴을 매칭할 수 있습니다.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.
셀레니움 환경설정 오류
0
52
2
네이버 로그인 관련
0
282
2
안녕하세요 셀레니움에 대해서 질문
0
89
1
크롤링 연습사이트 문의
0
102
2
선택자 질문
0
74
2
'특정 요소가 나타날 때까지 스크롤' 부분 에러
0
78
2
자동 로그인 질문
0
90
2
44강 제목, 링크
0
107
1
원하는 값이 없을 때
0
91
2
크롤링한 링크가 엑셀로 들어가면 작동이 안되요
0
230
2
셀레니움 PDF자료는 받을 수 있나요
0
100
2
글목록 추출하기
0
100
2
메일 자동화 로그인 중복방지문자해결 오류 및 명시적 대기 질문
0
91
2
강의 노트가 어디에 있는건가요?
0
80
2
강의 커리큘럼 질문
0
102
1
조건문 else 사용하지 않는 이유
0
77
2
셀레니움으로 접근할 수 없는 경우
0
98
2
웹페이지 변경
0
75
2
자바스크립트로 태그 선택 시 질문입니다.
1
65
2
수료증은 어떻게 받나요?
0
122
2
class명을 활용하여 선택자를 만들지 않는 경우..?
0
61
2
드라이버가 안 열려요
0
79
2
이거 해결방법 아시는 분?
0
121
2
네이버 지식인 크롤링..
0
202
2





