• 카테고리

    질문 & 답변
  • 세부 분야

    데이터 분석

  • 해결 여부

    미해결

같은 라인에서 두 개의 텍스트가 추출될 때

22.01.24 11:44 작성 조회수 121

0

네이버 기사 크롤링을 위해 강의를 따라 코드를 작성했습니다. 

제목 외에도 날짜 확인을 위해 기사가 작성된 시간을 불러와 저장하고 싶은데,

html을 확인하니 '입력시간'과 '최종수정시간'의 앞뒤 텍스트가 같아서 둘 다 불러와집니다. 

예를 들면 이런 식입니다.

 

" 기사입력 "

<span class="t11">2018.12.12. 오후 6:07</span>

" 최종수정 "

<span class="t11">2018.12.13. 오후 2:34</span>

 

혹시나 싶어 html_nodes를 통해서 불러와볼까 했는데 같은 노드셋의 같은 속성에 있는지 위와 같은 결과가 나옵니다.

둘 중 하나만 불러오고 싶은데 어떻게 하면 좋을까요?

 

답변 0

답변을 작성해보세요.

답변을 기다리고 있는 질문이에요.
첫번째 답변을 남겨보세요!