inflearn logo
강의

講義

知識共有

Rによるテキストマイニング(トップキーワードから感情分析まで)

[参考] NateNewsクロール(ウェブクロール実践編講義)

같은 라인에서 두 개의 텍스트가 추출될 때

238

cho100713813

投稿した質問数 1

0

네이버 기사 크롤링을 위해 강의를 따라 코드를 작성했습니다. 

제목 외에도 날짜 확인을 위해 기사가 작성된 시간을 불러와 저장하고 싶은데,

html을 확인하니 '입력시간'과 '최종수정시간'의 앞뒤 텍스트가 같아서 둘 다 불러와집니다. 

예를 들면 이런 식입니다.

 

" 기사입력 "

<span class="t11">2018.12.12. 오후 6:07</span>

" 최종수정 "

<span class="t11">2018.12.13. 오후 2:34</span>

 

혹시나 싶어 html_nodes를 통해서 불러와볼까 했는데 같은 노드셋의 같은 속성에 있는지 위와 같은 결과가 나옵니다.

둘 중 하나만 불러오고 싶은데 어떻게 하면 좋을까요?

 

텍스트마이닝 R 웹-크롤링

回答 0

셀레늄 실습중 문의

0

808

1

ADP 자격증 대비 강의 개설 문의

0

810

2

멜론편 진행하고 있는데 배너 닫는 버튼이 안보이네요.

0

636

2

옵션 선택에 따른 크롤링

0

741

1

셀레니움으로 네이버를 열고나서 갑자기 data;라는 주소로 바뀌고 내용이 사라집니다.

0

1273

2

ImportError: cannot import name 'webdriver' from partially initialized module 'selenium' 에러

0

2223

1

검색어 입력 관련

1

507

3

광고상품 외 표기 문의드립니다.

2

425

2

광고 상품 표기 추가문의

0

272

1

광고상품 표기외에 상품명도 보려고 하는데요. 에러가나네요.

1

447

1

R 오류

0

374

0

mac KoNLP 설치 오류

0

2006

1

워드클라우드 해상도

0

916

1

"try-error"

0

269

0

코드 에러

0

1190

1

utf-8로 바꾸기

0

315

3

R 4버전 이상에는 KoNLP를 지원 안하네요... ㅠㅠ

0

1550

3

긍정과 부정이 아닌 7가지 감정으로 분석하려면 어떻게 해야 하나요?

0

412

1

KoNLP 설치 관련 질문

0

459

3

감성분석 질의

0

378

2

코드 이해가 안가서 질문드립니다.

0

313

2

사전에 단어 등록하는 방법 문의

2

962

4

버퍼링

0

268

1

강의 예제자료 불일치

0

442

4