강의

멘토링

커뮤니티

Cộng đồng Hỏi & Đáp của Inflearn

Hình ảnh hồ sơ của cho100713813
cho100713813

câu hỏi đã được viết

Khai phá dữ liệu văn bản (Text Mining) bằng R (Từ từ khóa hàng đầu đến phân tích cảm xúc)

[Tham khảo] NateNews Crawling (Bài giảng thực hành về Web Crawling)

같은 라인에서 두 개의 텍스트가 추출될 때

Viết

·

235

0

네이버 기사 크롤링을 위해 강의를 따라 코드를 작성했습니다. 

제목 외에도 날짜 확인을 위해 기사가 작성된 시간을 불러와 저장하고 싶은데,

html을 확인하니 '입력시간'과 '최종수정시간'의 앞뒤 텍스트가 같아서 둘 다 불러와집니다. 

예를 들면 이런 식입니다.

 

" 기사입력 "

<span class="t11">2018.12.12. 오후 6:07</span>

" 최종수정 "

<span class="t11">2018.12.13. 오후 2:34</span>

 

혹시나 싶어 html_nodes를 통해서 불러와볼까 했는데 같은 노드셋의 같은 속성에 있는지 위와 같은 결과가 나옵니다.

둘 중 하나만 불러오고 싶은데 어떻게 하면 좋을까요?

 

텍스트마이닝R웹-크롤링

Câu trả lời

Câu hỏi này đang chờ câu trả lời
Hãy là người đầu tiên trả lời!
Hình ảnh hồ sơ của cho100713813
cho100713813

câu hỏi đã được viết

Đặt câu hỏi