같은 라인에서 두 개의 텍스트가 추출될 때
238
1 asked
네이버 기사 크롤링을 위해 강의를 따라 코드를 작성했습니다.
제목 외에도 날짜 확인을 위해 기사가 작성된 시간을 불러와 저장하고 싶은데,
html을 확인하니 '입력시간'과 '최종수정시간'의 앞뒤 텍스트가 같아서 둘 다 불러와집니다.
예를 들면 이런 식입니다.
" 기사입력 "
<span class="t11">2018.12.12. 오후 6:07</span>
" 최종수정 "
<span class="t11">2018.12.13. 오후 2:34</span>
혹시나 싶어 html_nodes를 통해서 불러와볼까 했는데 같은 노드셋의 같은 속성에 있는지 위와 같은 결과가 나옵니다.
둘 중 하나만 불러오고 싶은데 어떻게 하면 좋을까요?
Answer 0
셀레늄 실습중 문의
0
808
1
ADP 자격증 대비 강의 개설 문의
0
810
2
멜론편 진행하고 있는데 배너 닫는 버튼이 안보이네요.
0
636
2
옵션 선택에 따른 크롤링
0
741
1
셀레니움으로 네이버를 열고나서 갑자기 data;라는 주소로 바뀌고 내용이 사라집니다.
0
1273
2
ImportError: cannot import name 'webdriver' from partially initialized module 'selenium' 에러
0
2223
1
검색어 입력 관련
1
507
3
광고상품 외 표기 문의드립니다.
2
425
2
광고 상품 표기 추가문의
0
272
1
광고상품 표기외에 상품명도 보려고 하는데요. 에러가나네요.
1
447
1
R 오류
0
374
0
mac KoNLP 설치 오류
0
2006
1
워드클라우드 해상도
0
916
1
"try-error"
0
269
0
코드 에러
0
1190
1
utf-8로 바꾸기
0
315
3
R 4버전 이상에는 KoNLP를 지원 안하네요... ㅠㅠ
0
1550
3
긍정과 부정이 아닌 7가지 감정으로 분석하려면 어떻게 해야 하나요?
0
412
1
KoNLP 설치 관련 질문
0
459
3
감성분석 질의
0
378
2
코드 이해가 안가서 질문드립니다.
0
313
2
사전에 단어 등록하는 방법 문의
2
962
4
버퍼링
0
268
1
강의 예제자료 불일치
0
442
4

