inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

R로 하는 웹 크롤링 - 입문편

클리앙 크롤링 실습 중 문의사항

537

bee j

작성한 질문수 1

0

안녕하세요, 클리앙 크롤링편을 실습중인데 아래와 같이 오류가 뜨고 진행이 되지 않아 문의남깁니다.

url <- "https://www.clien.net/service/board/park?&od=T31&po=0"

b<-readLines(url, encoding = "UTF-8")

b2<-b[str_detect(b, "subject_fixed")]

b2

---

 [1] "\t\t\t\t\t\t<span class=\"subject_fixed\" data-role=\"list-title-text\" title=\"인권위는 성추행이 아니라 성희롱으로 표현했네요\">"                   

 [2] "\t\t\t\t\t\t<span class=\"subject_fixed\" data-role=\"list-title-text\" title=\"역시 낙연이 형이야! 사면해주러 왔구나.jpg\">"    

---

str_extract(b2,("(?<=title=\").*(?=\">")"))

---

> str_extract(b2,("(?<=title=\").*(?=\">")"))

+ str_extract(b2,("(?<=title=\").*(?=\">")"))

에러: 예상하지 못한 문자열 상수(string constant)입니다. in:

"str_extract(b2,("(?<=title=\").*(?=\">")"))

str_extract(b2,(""

---

어디가 잘못된 걸까요..?

답변 부탁드립니다..!

웹-크롤링 R

답변 1

1

코코

안녕하세요. bee j 님

Console창에 + ~ 와같이 뜬다는 것은 코드가 다 완결되지 읺았다라는 뜻입니다.

소괄호를 열면 닫아 줘야하고 중괄호를 열면 다시 닫아줘야합니다.

마찬가지로 " 또한 시작하면 " 다시 따옴표를 써주셔야합니다.

bee j 님께서 써주신 str_extract(b2,("(?<=title=\").*(?=\">")")) 코드를 보시면

따옴표가 총 다섯개인것을 볼수가 있습니다(당연히 짝수여야겠죠?). 코드를 아래와 같이 수정해주시길 바랍니다.

str_extract(b2,("(?<=title=\").*(?=\">)"))

클리앙 강의 시 문의 드립니다.

0

258

0

반복문 활용편 질문

0

291

0

크롤링 후 > character(0) 만 도출....ㅠㅠㅠ

0

326

0

readHTMLTable error

0

331

1

데이터 프레임 오류

0

433

1

str(m3)결과 문의

0

348

1

구글플레이 리뷰 크롤링

0

404

1

예제 파일은 없나요

0

203

0

html함수가 실행되지 않아요

0

262

1

readHTMLTable이 안되서..ㅠ

0

348

2

htmltab 라이브러리 삭제 ... readHTMLTable() 도 안되네요..

0

422

3

Rstudio 에서 한글로 작성한 주석이 깨집니다.

0

516

3

반복문 활용하기에서 질문 있습니다.

0

290

1

csv 한글깨짐 현상

0

560

1

클리앙 크롤링-1 총결과를 출력할 때

0

350

1

data frame 질문

0

1708

1

질문이 있습니다.

0

553

1

클리앙 크롤링-1 hit 관련 질문

0

276

1

("?<=).*(?=)") 활용 정규식 작성법 문의

0

363

1

클리앙 크롤링-1 질문

0

200

1

클리앙 크롤링 2에서 질문있습니다.

0

185

1

클리앙 싸이트 크롤링 질문 드립니다.

0

195

1

네이버 주식 크롤링 (1) 질문드립니다.

0

370

3

str_extract 자세하게 설명좀 해주세요

1

233

1