• 카테고리

    질문 & 답변
  • 세부 분야

    데이터 엔지니어링

  • 해결 여부

    미해결

셀레니움 특정 태그 누락

20.11.30 16:36 작성 조회수 164

0

안녕하세요. 강사님. 셀레니움 실습 중에 한가지 여쭤보고 싶은 부분이 생겨서요.

제가 특정 사이트에서 셀레니움으로 크롤링 테스트를 하고 있습니다.

해당 사이트에 있는 img 태그의 주소를 가져오는 것인데요.

페이지 다운을 하고, 로딩을 기다리는 작업까지 다 하여도 일부 img태그를 가져오지를 못합니다.

꼭 특정 img 태그만 누락되더라고요. 분명히 브라우저상에서 소스는 있는데요.

백번 넘게 시도했는데 특정 순서의 img 태그만 누락됩니다..

그래서 driver.page_source로 파싱해서 통째로 txt 파일로 저장도 시켜봤습니다.

하지만 역시나 동일하게 해당 태그는 누락되어 있습니다..

a링크 아래에 

::before == $0   

<img ~~~> </a>

이런 형태인데요. ::before == $0   이부분 때문인가 싶었지만

또 다른 이미지 태그는 조회가 되는걸보니 아닌 것 같고..

원인을 찾기가 어렵네요~ 이런 경우는 왜 발생되는 건지 힌트를 주실 수 있을까요?

답변 1

답변을 작성해보세요.

0

안녕하세요. 이 부분은 양해를 부탁드립니다.

강의 내용 외적인 부분에 대해 답변을 드리다보니, 강의 자체가 평생 수강이라서, 평생 매일같이 모든 분의 각자의 문의를 받아야 하는 경우들이 생겨서요. 또 말씀하신 부분도 어떤 사이트인지, 어떤 코드인지를 말씀하신 부분만 봐서는 이해하기가 어려워서 제대로 답변 드리기가 쉽지 않아서요.

감사합니다.