강의

멘토링

커뮤니티

Cộng đồng Hỏi & Đáp của Inflearn

Hình ảnh hồ sơ của yundosa2
yundosa2

câu hỏi đã được viết

Python cơ bản và tạo nhiều ứng dụng tự động hóa khác nhau bằng cách sử dụng web crawling

위시캣 파싱 질문입니다.

Viết

·

316

0

if response.status_code == 200 and response.ok:
soup = BeautifulSoup(response.text, 'html.parser')
projectList = soup.select('div.user-project > div')
ptag = soup.select_one('div.user-project > div > p')
for i in projectList:
print(i.text)
for a in ptag:
print(a.string)

기존의 table이 아닌 div로 퍼블리싱이 변경되어 다음과 같이 코드를 작성하였습니다.

현재 위시캣 퍼블리싱을 보면

<div class="body-3 mb10 header">

등록한 프로젝트

<p class="body-3-medium">

0건

</p>

</div>

이렇게 되어있습니다. p 태그가 div태그 안에 들어가있습니다. 제가 입력한 코드를 실행하면 

등록한 프로젝트0건

0건

계약한 프로젝트0건

0건

누적 완료 금액0원

0건

이렇게 나옵니다.

div 태그 안에 p 태그가 들어가 있으므로 등록한 프로젝트0건, 계약한 프로젝트0건, 누적 완료 금액0원 이렇게 나오는 것 같습니다.

혹시 이걸

등록한 프로젝트

0건

계약한 프로젝트

0건

누적 완료 금액

0건

이런식으로 출력할 수 있는 방법이 있을까요?

python웹-크롤링

Câu trả lời 2

0

따로 나오게 하는거 해결하셨나요??

0

niceman님의 프로필 이미지
niceman
Người chia sẻ kiến thức

네 안녕하세요.

원리는 똑같습니다.

자식으로 접근하시면 됩니다.

css 선택자로 하실 경우에는

div > p  선택 후 text 등으로 출력하시면 되고

포인트로 접근도 가능합니다.(find, select )

div.p 등

감사합니다.

Hình ảnh hồ sơ của yundosa2
yundosa2

câu hỏi đã được viết

Đặt câu hỏi