inflearn logo
강의

Course

Instructor

Introduction to Python and Creating Various Automated Applications Using Web Crawling

Scraping and Parsing Practice without a Web Browser (2) - Naver Cafe Automation

셀레니움 추가 질문합니다.

324

Seongmin Lee

21 asked

0

현재 Log-in이 필요한 웹사이트를 크롤링하고 있습니다.

제가 ID와 비번을 5개 정도 가지고 있는데요.

동일한 코드에 URL만 바꿔서 5개의 ID와 비번을 동시에 사용해서 크롤링을 하고 싶은데요 ㅠ

혹시 도움이 될 만한 패키지나 사이트 있으면 좀 추천부탁드려요.

python 웹-크롤링

Answer 3

0

niceman

감사합니다. ㅠ.ㅠ

0

Seongmin Lee

선생님 감사합니다!

Multi-processing 등 여러가지 알아보다가 역시 선생님께서 알려주신 방법이 최고군요.

ㅠㅠ 깊게 가니 힘듭니다,,, 부디 저희들에게 올바른 길을 새로운 강의를 통해 인도해주싶시요 ㅠ

0

niceman

네 안녕하세요.
만약 제가 구현한다면 각각 5개 아이디에 대해서 py 파일을 5개 만들어서
스케쥴러를 활용해서 각각 시간차를 두고 실행하는 방법이 좀더 좋을 것 같습니다.
또는
1개의 파일에 작성한다면, 로그인 -> 크롤링 -> 로그아웃 후 다시 다른 아이디 로그인 ...
이런 패턴으로 가야할텐데 아시다시피 대형 포털사이트 등 보안이 잘되어 있는 사이트는
해당 작업에 대한 보안이 잘되어 있어 방지될 가능성이 있습니다. (주로 이미지 문자를 입력하는 화면 등장)
각각 셀레니움으로 브라우저 마다 header 값을 다르게 하셔서 5개의 파일로 윈도우나 맥 에 스케쥴러로
실행하는 것을 권장해 드립니다.
크롤링의 세계에 깊게 들어가시는 군요.
감사합니다.

현재 예제에서 error 발생

0

376

3

유튜브 동영상 다운로드

0

1461

2

Atom 에디터 관련

0

346

1

위시켓 폼데이터

0

278

1

스케줄러 사용 관련 질문 드립니다

0

633

1

selenium 에러

0

438

1

Progress bar 쓰레드 관련

0

496

1

Install Package 관련 문의

0

337

1

tkinter 샘플 코드 실행 오류 건

0

1275

1

4-7-6 네이버 & 카카오 주식 정보 가져오기

0

387

1

네이버자동로그인_by_selenium

0

881

1

위시캣 로그인 처리 및 크롤링 질문

0

353

1

2-8-1 네이버이미지 크롤링 질문

1

610

3

li:nth-of-type 질문

0

357

2

에러가 뜨는데 잘 모르겠어요ㅠ

0

405

2

Install Packages 항목이 안보이는 이유가 뭘까요?

0

406

2

환경변수 Path 설정 방법

0

638

1

웹 브라우저 없는 스크랩핑 및 파싱 실습(1) - 인프런

0

340

1

웹 브라우저 없는 스크랩핑 및 파싱 실습(1) -git주소

0

487

3

download2-8-1. py질문

0

209

1

ip 차단 당하는 거 같은데 아무리 랜덤주고, sleep 줘도 안 되는데 다른 방법 더 있을까요??

0

648

1

인프런 환경이 바뀌어서 제나름대로 하는데

0

199

1

다시올려주신 예제파일로하는데

0

192

1

아직도 에러가뜨나보네요?

0

588

1