inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

R로 하는 웹 크롤링 - 실전편

이미지 다운로드하기

오류무시 code 관련

255

김병수

작성한 질문수 3

0

k <- 1
content <- c()


for(k in 52:length(fin_url)){

if(class(try(b <- readLines(fin_url[k], encoding = "UTF-8"))) == "try-error"){

cont <- ""
content <- c(content,cont) } else{

aindex <- which(str_detect(b,"</figure>"))

bindex <- which(str_detect(b, "<div class=\"foot_view\" data-cloud-area=\"addition\">"))

b2 <- paste(b[aindex:bindex], collapse = " ")

cont <- str_trim(gsub("<.*?>","",b2)) content <- c(content,cont)

cat("\n",k) }

연속으로 진행되지 않고 잘리는 상황이 지속됩니다.

오류 무시가 작동을 하지 않는 이유를 모르겠습니다.

오타인지요?

R 웹-크롤링

답변 1

0

코코

안녕하세요. 김병수 님

에러 메세지를 캡쳐해주시면 답변하는데 더 좋을 것 같습니다.

아마 제 생각으로는 url이 잘못 들어가 있지 않을까 싶습니다.

fin_url[k] 를 확인해보시기 바랍니다.

보배드림 content 관련 규칙 변경

0

394

0

readLines부터 에러가 뜨는데 어떻게 해야할까요 ㅜㅜ

0

314

0

에러 코드

0

387

2

최종 코드 입니다.

0

267

0

토큰을 제출해야 하는 사이트 크롤링

0

504

1

객체 'k'를 찾을 수 없습니다

0

366

1

소스코드

0

273

1

Referer

0

307

1

보베드림 강의 오류관련 질문입니다.

0

443

1

원하는 지역의 카페(맛집) 리스트 크롤링 for문 질문

0

320

1

원하는 지역의 카페(맛집) 리스트 크롤링 10:09분경 질문

0

381

1

셀레늄 사용시 W3C 에러 문제

0

266

1

수업관련 문의

0

333

3

위도 경도 가져오기

0

359

1

encoding 해결 방법

0

298

1

대량의 뉴스데이터를 보고싶다면 어떻게 해야하나요?

0

328

1

자바스크립트 및 iframe으로 구성되어 있는 웹페이지 크롤링 문의

0

442

1

어떤 문제로 인해 na 가 발생하는걸까요? 블로그 크롤링 부분입니다.

0

355

2

이미지 크롤링 개수를 80개 이상으로 하는 방법도 있을지요?

0

330

2

혹시 셀레니움을 스레드로 이용 할 수 있을까요?

0

539

1

네이버는 셀레니움을 통해 로그인할 경우 캡챠가 무조건 떠서 불가능하네요

1

677

5

셀레니움을 사용하지 않고 로그인을 하는 방법은 없나요?

0

242

2

웹 크롤링 방법

0

193

1

readlines. htmltab, readhtmltable 구별해 사용하는 방법?

0

272

2