2-8-1 네이버이미지 크롤링 질문
안녕하세요
셀레니움을 사용하지 않고 크롤링하는법을 익히기 위해 강의를 수강하였습니다
네이버이미지가 강의때와는 달리 별도로 요청해서 가져오는바람에 html을 파서하는 형태로는 받을수가 없는것같아요
셀레니움사용은 가급적이면 안하려고하는데
혹시 크롤링할수있는방법이있을까요??
html분석해보니 이미지소스가
https://search.pstatic.net/common/?src=http%3A%2F%2Fblogfiles.naver.net%2FMjAyMTExMjhfNzEg%2FMDAxNjM4MDU2NzQ5NDk3.3rzWIhB9n__9SSWJp-fF0uA4q3-AoGkVvfwt6hpqYm0g.eewDi5b-CXppMeJ_yHTN9vHtovtZNno54OUWU9kMrf0g.JPEG.daa2727%2FIMG_4606.jpg&type=a340
위에건데 html parser했을때는 아래처럼 encoding되어서 보이더라구요 이걸 decoding할수있으면 받을수있을것같은데 방법을 잘모르겠습니다
https%3A%2F%2Fsearch.pstatic.net%2Fcommon%2F%3Fsrc%3Dhttp%253A%252F%252Fblogfiles.naver.net%252FMjAyMTExMjhfNzEg%252FMDAxNjM4MDU2NzQ5NDk3.3rzWIhB9n__9SSWJp-fF0uA4q3-AoGkVvfwt6hpqYm0g.eewDi5b-CXppMeJ_yHTN9vHtovtZNno54OUWU9kMrf0g.JPEG.daa2727%252FIMG_4606.jpg%26type%3Dsc960_832
답변 3
1
말씀해주신 디코드코드를 활용하여 셀레니움 없이 이미지 다운로드 만들어봤습니다
스크롤 없이 보이는것만 다운로드되는거라 49~50개정도 다운되더라구요
브라우저를 스크롤 한 이후에 파서하면 더 다운로드될것같습니다
셀레니움없이 스크롤도 가능할까요???
궁극적으로는 네이버 이미지검색에 직접 "사자" 같은 query를 날려서
결과를 받아오는 방법을 알고 싶습니다
1
안녕하세요.
https://www.urldecoder.org/
사이트에서 위 주소를 붙여넣으신 후 decode 누르시면 원래 주소를 확인하실 수 있어요.
그 후 python에서 이에 맞게 코드를 작성하시면 됩니다.
아래 링크를 확인하세요!
https://jsikim1.tistory.com/219
현재 예제에서 error 발생
0
364
3
유튜브 동영상 다운로드
0
1444
2
Atom 에디터 관련
0
337
1
위시켓 폼데이터
0
274
1
스케줄러 사용 관련 질문 드립니다
0
627
1
selenium 에러
0
427
1
Progress bar 쓰레드 관련
0
489
1
Install Package 관련 문의
0
327
1
tkinter 샘플 코드 실행 오류 건
0
1265
1
4-7-6 네이버 & 카카오 주식 정보 가져오기
0
380
1
네이버자동로그인_by_selenium
0
873
1
위시캣 로그인 처리 및 크롤링 질문
0
343
1
li:nth-of-type 질문
0
350
2
에러가 뜨는데 잘 모르겠어요ㅠ
0
400
2
Install Packages 항목이 안보이는 이유가 뭘까요?
0
400
2
환경변수 Path 설정 방법
0
631
1
웹 브라우저 없는 스크랩핑 및 파싱 실습(1) - 인프런
0
332
1
웹 브라우저 없는 스크랩핑 및 파싱 실습(1) -git주소
0
472
3
download2-8-1. py질문
0
199
1
ip 차단 당하는 거 같은데 아무리 랜덤주고, sleep 줘도 안 되는데 다른 방법 더 있을까요??
0
639
1
인프런 환경이 바뀌어서 제나름대로 하는데
0
192
1
다시올려주신 예제파일로하는데
0
187
1
아직도 에러가뜨나보네요?
0
581
1
강의버전 업데이트좀 해주세요...
0
169
1





