inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

파이썬 입문 및 웹 크롤링을 활용한 다양한 자동화 어플리케이션 제작하기

위시캣 파싱 질문입니다.

320

highJoon

작성한 질문수 17

0

if response.status_code == 200 and response.ok:
soup = BeautifulSoup(response.text, 'html.parser')
projectList = soup.select('div.user-project > div')
ptag = soup.select_one('div.user-project > div > p')
for i in projectList:
print(i.text)
for a in ptag:
print(a.string)

기존의 table이 아닌 div로 퍼블리싱이 변경되어 다음과 같이 코드를 작성하였습니다.

현재 위시캣 퍼블리싱을 보면

<div class="body-3 mb10 header">

등록한 프로젝트

<p class="body-3-medium">

0건

</p>

</div>

이렇게 되어있습니다. p 태그가 div태그 안에 들어가있습니다. 제가 입력한 코드를 실행하면 

등록한 프로젝트0건

0건

계약한 프로젝트0건

0건

누적 완료 금액0원

0건

이렇게 나옵니다.

div 태그 안에 p 태그가 들어가 있으므로 등록한 프로젝트0건, 계약한 프로젝트0건, 누적 완료 금액0원 이렇게 나오는 것 같습니다.

혹시 이걸

등록한 프로젝트

0건

계약한 프로젝트

0건

누적 완료 금액

0건

이런식으로 출력할 수 있는 방법이 있을까요?

python 웹-크롤링

답변 2

0

리훼이

따로 나오게 하는거 해결하셨나요??

0

좋은사람

네 안녕하세요.

원리는 똑같습니다.

자식으로 접근하시면 됩니다.

css 선택자로 하실 경우에는

div > p  선택 후 text 등으로 출력하시면 되고

포인트로 접근도 가능합니다.(find, select )

div.p 등

감사합니다.

현재 예제에서 error 발생

0

367

3

유튜브 동영상 다운로드

0

1446

2

Atom 에디터 관련

0

337

1

위시켓 폼데이터

0

274

1

스케줄러 사용 관련 질문 드립니다

0

627

1

selenium 에러

0

428

1

Progress bar 쓰레드 관련

0

489

1

Install Package 관련 문의

0

328

1

tkinter 샘플 코드 실행 오류 건

0

1267

1

4-7-6 네이버 & 카카오 주식 정보 가져오기

0

381

1

네이버자동로그인_by_selenium

0

875

1

위시캣 로그인 처리 및 크롤링 질문

0

344

1

2-8-1 네이버이미지 크롤링 질문

1

604

3

li:nth-of-type 질문

0

350

2

에러가 뜨는데 잘 모르겠어요ㅠ

0

401

2

Install Packages 항목이 안보이는 이유가 뭘까요?

0

400

2

환경변수 Path 설정 방법

0

631

1

웹 브라우저 없는 스크랩핑 및 파싱 실습(1) - 인프런

0

333

1

웹 브라우저 없는 스크랩핑 및 파싱 실습(1) -git주소

0

475

3

download2-8-1. py질문

0

203

1

ip 차단 당하는 거 같은데 아무리 랜덤주고, sleep 줘도 안 되는데 다른 방법 더 있을까요??

0

645

1

인프런 환경이 바뀌어서 제나름대로 하는데

0

196

1

다시올려주신 예제파일로하는데

0

190

1

아직도 에러가뜨나보네요?

0

584

1