inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

파이썬 입문 및 웹 크롤링을 활용한 다양한 자동화 어플리케이션 제작하기

requests 통신 실습(로그인 처리) 고급(1) - 루리웹, 인프런

css 선택자 질문드려요

289

명한민

작성한 질문수 7

0

3-4-1.py에서 루리웹 크롤링을 하려고 하는데 css selector가 헷갈립니다. 혹 잘못된 것이 있으면 말씀해주세요

point = soup.select("table#marketread > tr:nth-child(5) > p ")

for i in point:

print(i.string)

강사님께서 하신걸랑 똑같이 밑의 글을 긁어 오려 하는데 table의 id 가 marketread이고 그 밑 tr자식의 5번째 요소 안에 있는 p 를 다 긁어오겠다고 생각하고 했는데 되지 않더라구요 혹 table 태그의 id css 선택자가 아닌 것인지 무엇이 잘못되었는지 모르겠습니다.

제가 가져올 글에 대한 선택자를 긁어오면 밑의 선택자가 됩니다. 혹 무엇이 잘못되었는지요?

marketread > tbody > tr:nth-child(5) > td > table > tbody > tr > td > p

그리고 강사님께서 하신 밑의 선택자는 table 자식들 중 첫번째 요소를 선택한다는 것인데 이 사이트의 table은 무수하게 많은데도 불구하고 어떻게 밑의 코드가 작동이 되는지 의문점입니다.

table:nth-child(1)

2가지 질문에 답변해주세면 정말 감사드리겠습니다. 강의 정말 도움이 많이 되는것같습니다.

python 웹-크롤링

답변 1

0

좋은사람

안녕하세요.

루리웹 소스가 자주 변경되어서 선택자를 제가 글로 직접 보기에는 무리가 있습니다.

다만, selectAll 메소드를 사용해서 전체를 가져온 후 파싱하시면 됩니다.

nth-child는 첫 번째 테이블을 가져오는 선택자입니다.

인프런 강의에 보면 css 강의가 있습니다. 해당 강의를 듣고 오셔야 앞으로 진행이 편하실 것 같습니다.

현재 예제에서 error 발생

0

367

3

유튜브 동영상 다운로드

0

1448

2

Atom 에디터 관련

0

337

1

위시켓 폼데이터

0

274

1

스케줄러 사용 관련 질문 드립니다

0

627

1

selenium 에러

0

428

1

Progress bar 쓰레드 관련

0

489

1

Install Package 관련 문의

0

328

1

tkinter 샘플 코드 실행 오류 건

0

1267

1

4-7-6 네이버 & 카카오 주식 정보 가져오기

0

381

1

네이버자동로그인_by_selenium

0

876

1

위시캣 로그인 처리 및 크롤링 질문

0

345

1

2-8-1 네이버이미지 크롤링 질문

1

604

3

li:nth-of-type 질문

0

350

2

에러가 뜨는데 잘 모르겠어요ㅠ

0

401

2

Install Packages 항목이 안보이는 이유가 뭘까요?

0

401

2

환경변수 Path 설정 방법

0

631

1

웹 브라우저 없는 스크랩핑 및 파싱 실습(1) - 인프런

0

333

1

웹 브라우저 없는 스크랩핑 및 파싱 실습(1) -git주소

0

477

3

download2-8-1. py질문

0

203

1

ip 차단 당하는 거 같은데 아무리 랜덤주고, sleep 줘도 안 되는데 다른 방법 더 있을까요??

0

645

1

인프런 환경이 바뀌어서 제나름대로 하는데

0

196

1

다시올려주신 예제파일로하는데

0

190

1

아직도 에러가뜨나보네요?

0

584

1