inflearn logo
강의

Course

Instructor

Web Crawling with R - Practical Edition

Trying out Selenium, Logging into Naver with R

네이버는 셀레니움을 통해 로그인할 경우 캡챠가 무조건 떠서 불가능하네요

677

wjdrnjsgh1595346

9 asked

1

파이썬의 경우 키조합으로 ctrl+c 와 ctrl+v를 만들어서 캡챠를 우회 하더군요 R에서는 불가능 한걸까요?

R 웹-크롤링

Answer 5

1

coco

안녕하세요 정권호님. 저도 하나 배워가네요.

좋은 정보 공유 감사드립니다 :) 

1

coco

안녕하세요 정권호님.

다음과 같이 'close'함수를 이용해서 강제 종료 시킬수 있습니다.

rD <- rsDriver(browser="fire",port=1004L) 

remDr <- rD[["client"]] 

remDr$navigate("https://www.naver.com") 

remDr$close()

## 다만 여기서 브라우저를 다시 열때에는  ## port number를 바꿔주셔야합니다.

rD <- rsDriver(browser="fire",port=1005L) 

remDr <- rD[["client"]] 

remDr$navigate("https://www.naver.com") 

1

coco

안녕하세요 정권호님.

해당 이슈를 확인하였고, 찾아보고 다시 답변드리도록 하겠습니다.

0

wjdrnjsgh1595346

답변 감사합니다! 포트를 재사용하는 방식도 얼떨결에 찾아냈습니다!

rD$server$process$kill_tree()

이 명령어를 쳐주면 포트를 재사용해도 문지가 되지 않더라구요! 

R은 구글링을 해도 원서자체만 나오지 자료가 많지가 않드라구요 ㅠㅜ

0

wjdrnjsgh1595346

writeClipboard("id")

webElem$sendKeysToElement(list(key = "control", "v"))

list안에 key라는 요소를 사용하니까 ctrl + v 키가 입력이 되네요!

또 하나 질문이 있는데  일정 포트로 셀레니움을 키고 작업을 처리한 후에 셀레니움을 끄고나서 다시 포트를 재사용하고 싶은데 rD$server$stop() 을해도 꺼지지가 않더군요 어떻게해야 포트를 재사용할 수 있을까요?

보배드림 content 관련 규칙 변경

0

394

0

readLines부터 에러가 뜨는데 어떻게 해야할까요 ㅜㅜ

0

314

0

에러 코드

0

387

2

최종 코드 입니다.

0

267

0

토큰을 제출해야 하는 사이트 크롤링

0

504

1

객체 'k'를 찾을 수 없습니다

0

366

1

소스코드

0

273

1

Referer

0

307

1

보베드림 강의 오류관련 질문입니다.

0

443

1

원하는 지역의 카페(맛집) 리스트 크롤링 for문 질문

0

320

1

원하는 지역의 카페(맛집) 리스트 크롤링 10:09분경 질문

0

381

1

셀레늄 사용시 W3C 에러 문제

0

266

1

수업관련 문의

0

333

3

오류무시 code 관련

0

255

1

위도 경도 가져오기

0

359

1

encoding 해결 방법

0

298

1

대량의 뉴스데이터를 보고싶다면 어떻게 해야하나요?

0

328

1

자바스크립트 및 iframe으로 구성되어 있는 웹페이지 크롤링 문의

0

442

1

어떤 문제로 인해 na 가 발생하는걸까요? 블로그 크롤링 부분입니다.

0

355

2

이미지 크롤링 개수를 80개 이상으로 하는 방법도 있을지요?

0

330

2

혹시 셀레니움을 스레드로 이용 할 수 있을까요?

0

539

1

셀레니움을 사용하지 않고 로그인을 하는 방법은 없나요?

0

242

2

웹 크롤링 방법

0

193

1

readlines. htmltab, readhtmltable 구별해 사용하는 방법?

0

272

2