다음 금융 싸이트 스크래핑 예제 질문2
241
7 asked
우선 스크래핑 할려는 부분은 다음과 같습니다.
다음 금융 싸이트 들어가시면 우측 하단 카테고리 중에 '시가총액' 을 눌러야 활성화되서
시가총액 리스트 나오는 부분을 스크래핑 할려고 합니다.
알려주신대로 개발자도구 활용해서 copy->selector를 하니
boxMarketTrend > div.box_contents > div:nth-child(6) > div.halfB.fr > ul > li:nth-child(1) > a
위와 같은 내용으로 나와서 실제 소스에 붙여 놓고 실행을 해봤을 때는 빈값을 가져오게 됩니다..
boxMarketTrend
태그만 실행했을때는 정상적으로 데이터를 가져오고
boxMarketTrend > div.box_contents
를 실행했을 때는 데이터를 못가져오는데요..
어떤 방법으로 해결해야할지 질문드립니다..
Answer 3
0
네
위와 같은 서비스를 제공하는 사이트 입니다.
참고로 정말 많은 사이트가 있으므로, 기능과 ui 등을 살펴보신 후 본인에게 맞는 걸로 학습하시면 됩니다.
0
안녕하세요. 종현님
제가 직접 스크랩핑 코드를 알려드리는 것은 정책에 맞지 않아 양해 부탁드려요 ㅠ.ㅠ
지금 카피한 것은 xpath를 카피 한 것입니다.
그대로 bs4 에 선택자로 활용하면 당연히 빈 값(엘리먼트)이 나오게 됩니다.
해당 xpath를 보시고 저 부분에 맞게 선택자로 변환해야 합니다.
이 부분에서는 css 기초 학습이 필요합니다. 수업중에 css 선택자를 활용하는 온라인
사이트 주소에 가셔서 다음 금융 정보 전체 소스를 복사해서 해당 부분의 선택자를 정확하게
선택하셔서 매개변수로 넣어줘야 해당 엘리먼트의 주식 값을 가져오게 되겠죠?
CSS 강의를 한 무료로 들어보시고 다시 보시면 금방 해당 엘리먼트의 값을 파싱할 수 있을 것 입니다.
현재 예제에서 error 발생
0
367
3
유튜브 동영상 다운로드
0
1447
2
Atom 에디터 관련
0
337
1
위시켓 폼데이터
0
274
1
스케줄러 사용 관련 질문 드립니다
0
627
1
selenium 에러
0
428
1
Progress bar 쓰레드 관련
0
489
1
Install Package 관련 문의
0
328
1
tkinter 샘플 코드 실행 오류 건
0
1267
1
4-7-6 네이버 & 카카오 주식 정보 가져오기
0
381
1
네이버자동로그인_by_selenium
0
875
1
위시캣 로그인 처리 및 크롤링 질문
0
344
1
2-8-1 네이버이미지 크롤링 질문
1
604
3
li:nth-of-type 질문
0
350
2
에러가 뜨는데 잘 모르겠어요ㅠ
0
401
2
Install Packages 항목이 안보이는 이유가 뭘까요?
0
400
2
환경변수 Path 설정 방법
0
631
1
웹 브라우저 없는 스크랩핑 및 파싱 실습(1) - 인프런
0
333
1
웹 브라우저 없는 스크랩핑 및 파싱 실습(1) -git주소
0
475
3
download2-8-1. py질문
0
203
1
ip 차단 당하는 거 같은데 아무리 랜덤주고, sleep 줘도 안 되는데 다른 방법 더 있을까요??
0
645
1
인프런 환경이 바뀌어서 제나름대로 하는데
0
196
1
다시올려주신 예제파일로하는데
0
190
1
아직도 에러가뜨나보네요?
0
584
1

