크롤링 로켓배송 제외
안녕하세요. 문의드립니다.
쿠팡 로켓배송 크롤링강의를 보고 쿠팡 1~10(위에 빨간리본상품) 중 로켓배송상품, 광고상품을 빼고 상품의 이름을 가져오고 싶은데요. 강의 보고 어떻게 적용을 해야할지 해매고 있어 문의드립니다.
초보라 모르는게 많네요. 도와주세요~

답변 1
0
여러가지 방법이 있습니다.
일단 1위부터 10위까지 가져올때 지금 현재 코드에 작성하신
c_number1 = item.select_one(".number no-1")
c_number2 = item.select_one(".number no-2")
c_number3 = item.select_one(".number no-3")이렇게는 10까지 해야하니 비효율적이죠.
하지만 소스코드를 확인해보시면 number라는 클래스만 가져와도 딱 10개입니다. 그러니까 no-1~no-10을 붙여주지 않더라도 딱 1위부터 10위까지만 가져오게 되는겁니다.
number = item.select_one(".number")
if not number:
continue
다른 방법은 반복문을 시작할때
for item in items: 이부분을
for item in items[:10]: 이렇게만 바꿔주면
item에서 딱 1위부터 10위까지만 반복에 사용되기때문에 number 클래스를 찾는 과정을 빼도 원하시는 결과를 얻으실수 있습니다.
0
이미 맨 처음에 작성하신 코드에 있는
if badge:
continue이 부분이 뱃지가 있으면 아래 코드를 실행안하고 반복문으로 돌아가는 코드입니다.
그렇다는건 로켓배송 상품을 출력하지 않고 넘어간다는 거죠.
suki님이 작성하신 코드와 제가 알려드린 부분을 조합하면 원하시는게 모두 해결됩니다.
제가 모든 부분을 다 짜드리는 것보다 힌트를 조합해서 직접 하시는게 공부하시는데 훨씬 도움이 될겁니다.
그리고 일단 마지막 질문에 올리신 코드를 실행시켜 보시면 답이 나옵니다.
화이팅!!
멜론 사이트 수집부터 안됩니다
0
62
1
강의 시점이랑 현재랑 네이버 사이트 변화가 많은거 같아서 질문드립니다.
0
58
1
-href 가져오기
0
91
2
수업내용 프로젝트의 완성된 코드는 제공이 안돼나요?
0
157
1
안녕하세요 쿠팡 크롤링 막힌거 같아요 3번돌리니깐 막았어요 해결방법없을까요?
0
3653
1
쿠팡 BeautifullSoup 헤더넣어도 막히네요
0
443
1
네이버 쇼핑 크롤링 1 코드 사용 시, 접속 제한됐을 때의 해결 방법이 궁금합니다.
0
3185
1
추가 강의 업데이트 있나요?
0
246
1
lambda 중에 문의가 있습니다.
0
270
1
텔레그램 sendMessage 시 400에러가 뜹니다.
0
905
2
ftp 로긴 문제입니다. ㅜ
0
410
2
네이버 쇼핑 크롤링 질문입니다.
0
369
1
XPATH 네이버에서 카페 찾는 과정 문의입니다.
1
315
1
셀레니움 By.XPATH 를 이용한 키워드 입력 작성 질문입니다.
0
671
2
쿠팡 이미지 파일 다운받기에서 동일하게 코드 작성 후 요청하였지만 파일 다운로드가 안됩니다.
0
815
2
파이썬에 키워드를 치는게 아닌...
0
276
2
50프로 수강중입니다~
0
220
1
제품 링크를 타고 들어가야 원하는 정보가 나오는 사이트
0
385
2
lst = lst50 + lst100 이거 대신에
0
323
2
증권, 메일 등 서비스 목록을 못가져와요 ㅠㅠ
1
286
1
네이버에 view탭이 업데이트가 됐는지 없어졌네요... ㅠㅠ
1
245
1
선생님이랑 똑같이 적었는데 저는 왜 오류가 날까요?ㅠ
0
355
2
네이버쇼핑 크롤링 문의
0
430
2
asyncio.run() cannot be called from a running event loop 에러 질문 드립니다
0
3906
4





