• 카테고리

    질문 & 답변
  • 세부 분야

    프로그래밍 언어

  • 해결 여부

    미해결

클리앙 크롤링 실습 중 문의사항

21.01.25 22:44 작성 조회수 299

0

안녕하세요, 클리앙 크롤링편을 실습중인데 아래와 같이 오류가 뜨고 진행이 되지 않아 문의남깁니다.

url <- "https://www.clien.net/service/board/park?&od=T31&po=0"

b<-readLines(url, encoding = "UTF-8")

b2<-b[str_detect(b, "subject_fixed")]

b2

---

 [1] "\t\t\t\t\t\t<span class=\"subject_fixed\" data-role=\"list-title-text\" title=\"인권위는 성추행이 아니라 성희롱으로 표현했네요\">"                   

 [2] "\t\t\t\t\t\t<span class=\"subject_fixed\" data-role=\"list-title-text\" title=\"역시 낙연이 형이야! 사면해주러 왔구나.jpg\">"    

---

str_extract(b2,("(?<=title=\").*(?=\">")"))

---

> str_extract(b2,("(?<=title=\").*(?=\">")"))

+ str_extract(b2,("(?<=title=\").*(?=\">")"))

에러: 예상하지 못한 문자열 상수(string constant)입니다. in:

"str_extract(b2,("(?<=title=\").*(?=\">")"))

str_extract(b2,(""

---

어디가 잘못된 걸까요..?

답변 부탁드립니다..!

답변 1

답변을 작성해보세요.

1

안녕하세요. bee j 님

Console창에 + ~ 와같이 뜬다는 것은 코드가 다 완결되지 읺았다라는 뜻입니다.

소괄호를 열면 닫아 줘야하고 중괄호를 열면 다시 닫아줘야합니다.

마찬가지로 " 또한 시작하면 " 다시 따옴표를 써주셔야합니다.

bee j 님께서 써주신 str_extract(b2,("(?<=title=\").*(?=\">")")) 코드를 보시면

따옴표가 총 다섯개인것을 볼수가 있습니다(당연히 짝수여야겠죠?). 코드를 아래와 같이 수정해주시길 바랍니다.

str_extract(b2,("(?<=title=\").*(?=\">)"))