클리앙 크롤링 실습 중 문의사항
537
작성한 질문수 1
안녕하세요, 클리앙 크롤링편을 실습중인데 아래와 같이 오류가 뜨고 진행이 되지 않아 문의남깁니다.
url <- "https://www.clien.net/service/board/park?&od=T31&po=0"
b<-readLines(url, encoding = "UTF-8")
b2<-b[str_detect(b, "subject_fixed")]
b2
---
[1] "\t\t\t\t\t\t<span class=\"subject_fixed\" data-role=\"list-title-text\" title=\"인권위는 성추행이 아니라 성희롱으로 표현했네요\">"
[2] "\t\t\t\t\t\t<span class=\"subject_fixed\" data-role=\"list-title-text\" title=\"역시 낙연이 형이야! 사면해주러 왔구나.jpg\">"
---
str_extract(b2,("(?<=title=\").*(?=\">")"))
---
> str_extract(b2,("(?<=title=\").*(?=\">")"))
+ str_extract(b2,("(?<=title=\").*(?=\">")"))
에러: 예상하지 못한 문자열 상수(string constant)입니다. in:
"str_extract(b2,("(?<=title=\").*(?=\">")"))
str_extract(b2,(""
---
어디가 잘못된 걸까요..?
답변 부탁드립니다..!
답변 1
1
안녕하세요. 님
Console창에 + ~ 와같이 뜬다는 것은 코드가 다 완결되지 읺았다라는 뜻입니다.
소괄호를 열면 닫아 줘야하고 중괄호를 열면 다시 닫아줘야합니다.
마찬가지로 " 또한 시작하면 " 다시 따옴표를 써주셔야합니다.
bee j 님께서 써주신 str_extract(b2,("(?<=title=\").*(?=\">")")) 코드를 보시면
따옴표가 총 다섯개인것을 볼수가 있습니다(당연히 짝수여야겠죠?). 코드를 아래와 같이 수정해주시길 바랍니다.
str_extract(b2,("(?<=title=\").*(?=\">)"))
클리앙 강의 시 문의 드립니다.
0
258
0
반복문 활용편 질문
0
291
0
크롤링 후 > character(0) 만 도출....ㅠㅠㅠ
0
326
0
readHTMLTable error
0
331
1
데이터 프레임 오류
0
433
1
str(m3)결과 문의
0
348
1
구글플레이 리뷰 크롤링
0
404
1
예제 파일은 없나요
0
203
0
html함수가 실행되지 않아요
0
262
1
readHTMLTable이 안되서..ㅠ
0
348
2
htmltab 라이브러리 삭제 ... readHTMLTable() 도 안되네요..
0
422
3
Rstudio 에서 한글로 작성한 주석이 깨집니다.
0
516
3
반복문 활용하기에서 질문 있습니다.
0
290
1
csv 한글깨짐 현상
0
560
1
클리앙 크롤링-1 총결과를 출력할 때
0
350
1
data frame 질문
0
1708
1
질문이 있습니다.
0
553
1
클리앙 크롤링-1 hit 관련 질문
0
276
1
("?<=).*(?=)") 활용 정규식 작성법 문의
0
363
1
클리앙 크롤링-1 질문
0
200
1
클리앙 크롤링 2에서 질문있습니다.
0
185
1
클리앙 싸이트 크롤링 질문 드립니다.
0
195
1
네이버 주식 크롤링 (1) 질문드립니다.
0
370
3
str_extract 자세하게 설명좀 해주세요
1
233
1





