• 카테고리

    질문 & 답변
  • 세부 분야

    데이터 분석

  • 해결 여부

    미해결

선택자 오류

19.12.19 12:00 작성 조회수 108

0

파이썬 입문 및 웹 크롤링을 활용한 다양한 자동화 어플리케이션 제작하기 강좌에서

챕터3 강의에 3-4-의 소스에 관한 질문입니다.  아래의 코딩서 부터 error가 발생합니다.

article = soup.select_one("table:nth-of-type(3)").find_all('p')
#print(article)
for i in article:
if i.string is not None and i.img == None:
print(i.string)
Traceback (most recent call last):
  File "D:\workspace_big\3-4-1.py", line 32, in <module>
    article=soup.select_one("table:nth-of-type(3)").find_all('p')
AttributeError: 'NoneType' object has no attribute 'find_all'

스크레핑 하고 싶은 url은

https://market.ruliweb.com/read.htm?table=market_ngc&page=1&num=565967&find=&ftext=

입니다.

확인 문답 부탁드립니다


  

답변 1

답변을 작성해보세요.

0

안녕하세요.

NoneType 에러는 p 태그가 존재하지 않아서 나오는 예외 입니다.

해당 URL은 로그인이 필요한 사항이므로, Selenium 등으로 로그인 처리 -> 세션 획득 후 -> 수집하셔야 될 것같습니다.

타 URL은 제가 직접 살펴보기가 어려이므로, 이점 양해 부탁드립니다.