inflearn logo
강의

Khóa học

Chia sẻ kiến thức

Python cơ bản và tạo nhiều ứng dụng tự động hóa khác nhau bằng cách sử dụng web crawling

위시캣 파싱 질문입니다.

320

highJoon

17 câu hỏi đã được viết

0

if response.status_code == 200 and response.ok:
soup = BeautifulSoup(response.text, 'html.parser')
projectList = soup.select('div.user-project > div')
ptag = soup.select_one('div.user-project > div > p')
for i in projectList:
print(i.text)
for a in ptag:
print(a.string)

기존의 table이 아닌 div로 퍼블리싱이 변경되어 다음과 같이 코드를 작성하였습니다.

현재 위시캣 퍼블리싱을 보면

<div class="body-3 mb10 header">

등록한 프로젝트

<p class="body-3-medium">

0건

</p>

</div>

이렇게 되어있습니다. p 태그가 div태그 안에 들어가있습니다. 제가 입력한 코드를 실행하면 

등록한 프로젝트0건

0건

계약한 프로젝트0건

0건

누적 완료 금액0원

0건

이렇게 나옵니다.

div 태그 안에 p 태그가 들어가 있으므로 등록한 프로젝트0건, 계약한 프로젝트0건, 누적 완료 금액0원 이렇게 나오는 것 같습니다.

혹시 이걸

등록한 프로젝트

0건

계약한 프로젝트

0건

누적 완료 금액

0건

이런식으로 출력할 수 있는 방법이 있을까요?

python 웹-크롤링

Câu trả lời 2

0

lhan05181280

따로 나오게 하는거 해결하셨나요??

0

niceman

네 안녕하세요.

원리는 똑같습니다.

자식으로 접근하시면 됩니다.

css 선택자로 하실 경우에는

div > p  선택 후 text 등으로 출력하시면 되고

포인트로 접근도 가능합니다.(find, select )

div.p 등

감사합니다.

현재 예제에서 error 발생

0

367

3

유튜브 동영상 다운로드

0

1448

2

Atom 에디터 관련

0

337

1

위시켓 폼데이터

0

274

1

스케줄러 사용 관련 질문 드립니다

0

627

1

selenium 에러

0

428

1

Progress bar 쓰레드 관련

0

489

1

Install Package 관련 문의

0

328

1

tkinter 샘플 코드 실행 오류 건

0

1267

1

4-7-6 네이버 & 카카오 주식 정보 가져오기

0

381

1

네이버자동로그인_by_selenium

0

876

1

위시캣 로그인 처리 및 크롤링 질문

0

344

1

2-8-1 네이버이미지 크롤링 질문

1

604

3

li:nth-of-type 질문

0

350

2

에러가 뜨는데 잘 모르겠어요ㅠ

0

401

2

Install Packages 항목이 안보이는 이유가 뭘까요?

0

400

2

환경변수 Path 설정 방법

0

631

1

웹 브라우저 없는 스크랩핑 및 파싱 실습(1) - 인프런

0

333

1

웹 브라우저 없는 스크랩핑 및 파싱 실습(1) -git주소

0

475

3

download2-8-1. py질문

0

203

1

ip 차단 당하는 거 같은데 아무리 랜덤주고, sleep 줘도 안 되는데 다른 방법 더 있을까요??

0

645

1

인프런 환경이 바뀌어서 제나름대로 하는데

0

196

1

다시올려주신 예제파일로하는데

0

190

1

아직도 에러가뜨나보네요?

0

584

1