-
카테고리
-
세부 분야
데이터 분석
-
해결 여부
미해결
같은 라인에서 두 개의 텍스트가 추출될 때
22.01.24 11:44 작성 조회수 121
0
네이버 기사 크롤링을 위해 강의를 따라 코드를 작성했습니다.
제목 외에도 날짜 확인을 위해 기사가 작성된 시간을 불러와 저장하고 싶은데,
html을 확인하니 '입력시간'과 '최종수정시간'의 앞뒤 텍스트가 같아서 둘 다 불러와집니다.
예를 들면 이런 식입니다.
" 기사입력 "
<span class="t11">2018.12.12. 오후 6:07</span>
" 최종수정 "
<span class="t11">2018.12.13. 오후 2:34</span>
혹시나 싶어 html_nodes를 통해서 불러와볼까 했는데 같은 노드셋의 같은 속성에 있는지 위와 같은 결과가 나옵니다.
둘 중 하나만 불러오고 싶은데 어떻게 하면 좋을까요?
답변을 작성해보세요.
답변 0