강의

멘토링

커뮤니티

Inflearn コミュニティ Q&A

cho100713813 のプロフィール画像
cho100713813

投稿した質問数

Rによるテキストマイニング(トップキーワードから感情分析まで)

[参考] NateNewsクロール(ウェブクロール実践編講義)

같은 라인에서 두 개의 텍스트가 추출될 때

作成

·

235

0

네이버 기사 크롤링을 위해 강의를 따라 코드를 작성했습니다. 

제목 외에도 날짜 확인을 위해 기사가 작성된 시간을 불러와 저장하고 싶은데,

html을 확인하니 '입력시간'과 '최종수정시간'의 앞뒤 텍스트가 같아서 둘 다 불러와집니다. 

예를 들면 이런 식입니다.

 

" 기사입력 "

<span class="t11">2018.12.12. 오후 6:07</span>

" 최종수정 "

<span class="t11">2018.12.13. 오후 2:34</span>

 

혹시나 싶어 html_nodes를 통해서 불러와볼까 했는데 같은 노드셋의 같은 속성에 있는지 위와 같은 결과가 나옵니다.

둘 중 하나만 불러오고 싶은데 어떻게 하면 좋을까요?

 

텍스트마이닝R웹-크롤링

回答

回答を待っている質問です
最初の回答を残してください!
cho100713813 のプロフィール画像
cho100713813

投稿した質問数

質問する