inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

파이썬 입문 및 웹 크롤링을 활용한 다양한 자동화 어플리케이션 제작하기

requests 통신 실습(로그인 처리) 고급(2) - 위시캣(Wishket)

파싱

382

윤우섭

작성한 질문수 20

0

선생님

이게 파싱이 예전꺼랑 달리 이런식으로 떨어지는데 div 안에 p가 있어서 선생님꺼처럼 유사하게 마지막 줄 이름만 바꿔서 div.string이런식으로 해도 안에 있는 p떄문에 오류가 뜨는 것 같습니다 이런식으로 파싱되는 경우엔 어떻게 해야 결과값이 선생님처럼 나올까요

 

<div class="body-3 mb10 header">등록한 프로젝트<p class="body-3-medium">0건</p></div>

웹-크롤링 python

답변 4

0

MIKE.aeon

강사님이 알려주신 사이트에선 해당 예제와 비슷한 샘플이 있는데, 잘 되지 않더라구요. 그래서 아래 질문중에 string/text 질문의 답변을 참고해서 약간의 트릭을 사용했습니다.

string/text 차이점은 지금강좌의 맨아래 질문을 참고하세요(클릭).

for i in projectList:
print(i)
print(i.string)==> None
print(i.text) ==> '지원한 프로젝트0건'
print(i.text.replace(i.find('p').string, '')) ==> '계약한 프로젝트'
print(i.find('p').string) ==> '0건'

text로 가져와서 뒷부분을 잘랐습니다.

정식은 아닌거 같아서 참고만 하세요.

0

리훼이

해결하셨나요??

0

highJoon

코드를 적어주실수 있나요 부탁드립니다 해결이 안됩니다

0

좋은사람

https://www.w3schools.com/cssref/trysel.asp

p 태그가 div 태그의 자식이므로, 여러가지 방법을 사용하실 수 있습니다. nextChild로 접근하셔도 되고

div > p 등으로 접근하셔도 text 값을 뽑아올 수 있습니다.

 강의에서 알려드렸던 online 셀렉터를 사용해서 바로 테스트 해보시면 됩니다.

CSS 셀렉터는 직접 해보셔서 원하시는 값이 나올 때까지 트라이 해보셔야 실력이 금방 향상 됩니다.

감사합니다.

현재 예제에서 error 발생

0

367

3

유튜브 동영상 다운로드

0

1447

2

Atom 에디터 관련

0

337

1

위시켓 폼데이터

0

274

1

스케줄러 사용 관련 질문 드립니다

0

627

1

selenium 에러

0

428

1

Progress bar 쓰레드 관련

0

489

1

Install Package 관련 문의

0

328

1

tkinter 샘플 코드 실행 오류 건

0

1267

1

4-7-6 네이버 & 카카오 주식 정보 가져오기

0

381

1

네이버자동로그인_by_selenium

0

875

1

위시캣 로그인 처리 및 크롤링 질문

0

344

1

2-8-1 네이버이미지 크롤링 질문

1

604

3

li:nth-of-type 질문

0

350

2

에러가 뜨는데 잘 모르겠어요ㅠ

0

401

2

Install Packages 항목이 안보이는 이유가 뭘까요?

0

400

2

환경변수 Path 설정 방법

0

631

1

웹 브라우저 없는 스크랩핑 및 파싱 실습(1) - 인프런

0

333

1

웹 브라우저 없는 스크랩핑 및 파싱 실습(1) -git주소

0

475

3

download2-8-1. py질문

0

203

1

ip 차단 당하는 거 같은데 아무리 랜덤주고, sleep 줘도 안 되는데 다른 방법 더 있을까요??

0

645

1

인프런 환경이 바뀌어서 제나름대로 하는데

0

196

1

다시올려주신 예제파일로하는데

0

190

1

아직도 에러가뜨나보네요?

0

584

1