강의

멘토링

커뮤니티

Inflearn Community Q&A

cho100713813's profile image
cho100713813

asked

Text Mining with R (From Top Keywords to Sentiment Analysis)

[Reference] NateNews Crawling (Web Crawling Practical Course)

같은 라인에서 두 개의 텍스트가 추출될 때

Written on

·

235

0

네이버 기사 크롤링을 위해 강의를 따라 코드를 작성했습니다. 

제목 외에도 날짜 확인을 위해 기사가 작성된 시간을 불러와 저장하고 싶은데,

html을 확인하니 '입력시간'과 '최종수정시간'의 앞뒤 텍스트가 같아서 둘 다 불러와집니다. 

예를 들면 이런 식입니다.

 

" 기사입력 "

<span class="t11">2018.12.12. 오후 6:07</span>

" 최종수정 "

<span class="t11">2018.12.13. 오후 2:34</span>

 

혹시나 싶어 html_nodes를 통해서 불러와볼까 했는데 같은 노드셋의 같은 속성에 있는지 위와 같은 결과가 나옵니다.

둘 중 하나만 불러오고 싶은데 어떻게 하면 좋을까요?

 

텍스트마이닝R웹-크롤링

Answer

This question is waiting for answers
Be the first to answer!
cho100713813's profile image
cho100713813

asked

Ask a question