인프런 영문 브랜드 로고
인프런 영문 브랜드 로고

인프런 커뮤니티 질문&답변

bee j님의 프로필 이미지
bee j

작성한 질문수

R로 하는 웹 크롤링 - 입문편

클리앙 크롤링 실습 중 문의사항

작성

·

460

0

안녕하세요, 클리앙 크롤링편을 실습중인데 아래와 같이 오류가 뜨고 진행이 되지 않아 문의남깁니다.

url <- "https://www.clien.net/service/board/park?&od=T31&po=0"

b<-readLines(url, encoding = "UTF-8")

b2<-b[str_detect(b, "subject_fixed")]

b2

---

 [1] "\t\t\t\t\t\t<span class=\"subject_fixed\" data-role=\"list-title-text\" title=\"인권위는 성추행이 아니라 성희롱으로 표현했네요\">"                   

 [2] "\t\t\t\t\t\t<span class=\"subject_fixed\" data-role=\"list-title-text\" title=\"역시 낙연이 형이야! 사면해주러 왔구나.jpg\">"    

---

str_extract(b2,("(?<=title=\").*(?=\">")"))

---

> str_extract(b2,("(?<=title=\").*(?=\">")"))

+ str_extract(b2,("(?<=title=\").*(?=\">")"))

에러: 예상하지 못한 문자열 상수(string constant)입니다. in:

"str_extract(b2,("(?<=title=\").*(?=\">")"))

str_extract(b2,(""

---

어디가 잘못된 걸까요..?

답변 부탁드립니다..!

답변 1

1

코코님의 프로필 이미지
코코
지식공유자

안녕하세요. bee j 님

Console창에 + ~ 와같이 뜬다는 것은 코드가 다 완결되지 읺았다라는 뜻입니다.

소괄호를 열면 닫아 줘야하고 중괄호를 열면 다시 닫아줘야합니다.

마찬가지로 " 또한 시작하면 " 다시 따옴표를 써주셔야합니다.

bee j 님께서 써주신 str_extract(b2,("(?<=title=\").*(?=\">")")) 코드를 보시면

따옴표가 총 다섯개인것을 볼수가 있습니다(당연히 짝수여야겠죠?). 코드를 아래와 같이 수정해주시길 바랍니다.

str_extract(b2,("(?<=title=\").*(?=\">)"))

bee j님의 프로필 이미지
bee j

작성한 질문수

질문하기