inflearn logo
강의

Course

Instructor

Introduction to Python and Creating Various Automated Applications Using Web Crawling

How to use BeautifulSoup and Simple Web Parsing Practice (1) - Naver, Daum, Inflearn

2-7-1.py 예제 관련 질문

228

Jeong JongHyun

7 asked

0

강좌의 예제하고 현재 실제 Daum금융 싸이트 들어갔을때의 소스가 좀 다른 거 같아 질문 드립니다.

div 클래스 안의 ul 클래서 안의 링크 안의 제목을 가져오는 부분을 어찌해야 할지 몰라서 질문 드립니다.

top = soup.select("div.titB")

이런 방식으로 했을때는 값을 가져오지 못하는데요.. 어떤 방법으로 해야할지 질문드립니다..ㅠ

참고로, 현재 Daum금융 싸이트의 시가총액 부분을 개발자 도구를 통해 확인해 본 태그 아래에 첨부 드립니다.

<ul class="list boxKosdaq"><li><em class="ty01">1</em>

<a href="/quotes/A153710" class="txt">옵티팜

<p data-realtime-trade-price="yes">11,700

<span class="num up1" data-realtime-change-price="yes">↑2,700

<span class="up1" data-realtime-change-ratio="yes">+30.00%

<p class="num" data-realtime-acc-trade-volume="yes">15,148,591

  • <em class="ty02">2

    <a href="/quotes/A069330" class="txt">유아이디

    <p data-realtime-trade-price="yes">1,760

    <span class="num up1" data-realtime-change-price="yes">↑405

    <span class="up1" data-realtime-change-ratio="yes">+29.89%

    <p class="num" data-realtime-acc-trade-volume="yes">573,047

  • <em class="ty03">3

    <a href="/quotes/A045890" class="txt">DB라이텍

    <p data-realtime-trade-price="yes">2,610

    <span class="num up1" data-realtime-change-price="yes">↑600

    <span class="up1" data-realtime-change-ratio="yes">+29.85%

    <p class="num" data-realtime-acc-trade-volume="yes">7,327,336

  • <em class="ty04">4

    <a href="/quotes/A048430" class="txt">유라테크

    <p data-realtime-trade-price="yes">6,660

    <span class="num up1" data-realtime-change-price="yes">↑1,530

    <span class="up1" data-realtime-change-ratio="yes">+29.82%

    <p class="num" data-realtime-acc-trade-volume="yes">1,732,617

  • <em class="ty05">5

    <a href="/quotes/A226360" class="txt">이엑스티

    웹-크롤링 python

    Answer 1

    0

    niceman

    안녕하세요.

    해당 태그를 보니 반복되는 부분을 묶어서 bs4로 태그 > 클래스 선택자로 묶어서 처리하셔야 할 것같습니다.

    크롤링에 대한 정확한 태그 사용은 정책상 알려드리기가 어렵습니다. selectOne 또는 selectAll 태그

    를 구글에서 검색 후 사용법을 확인해 보시기 바랍니다.

    현재 예제에서 error 발생

    0

    367

    3

    유튜브 동영상 다운로드

    0

    1448

    2

    Atom 에디터 관련

    0

    337

    1

    위시켓 폼데이터

    0

    274

    1

    스케줄러 사용 관련 질문 드립니다

    0

    627

    1

    selenium 에러

    0

    428

    1

    Progress bar 쓰레드 관련

    0

    489

    1

    Install Package 관련 문의

    0

    328

    1

    tkinter 샘플 코드 실행 오류 건

    0

    1267

    1

    4-7-6 네이버 & 카카오 주식 정보 가져오기

    0

    381

    1

    네이버자동로그인_by_selenium

    0

    876

    1

    위시캣 로그인 처리 및 크롤링 질문

    0

    345

    1

    2-8-1 네이버이미지 크롤링 질문

    1

    604

    3

    li:nth-of-type 질문

    0

    350

    2

    에러가 뜨는데 잘 모르겠어요ㅠ

    0

    401

    2

    Install Packages 항목이 안보이는 이유가 뭘까요?

    0

    400

    2

    환경변수 Path 설정 방법

    0

    631

    1

    웹 브라우저 없는 스크랩핑 및 파싱 실습(1) - 인프런

    0

    333

    1

    웹 브라우저 없는 스크랩핑 및 파싱 실습(1) -git주소

    0

    475

    3

    download2-8-1. py질문

    0

    203

    1

    ip 차단 당하는 거 같은데 아무리 랜덤주고, sleep 줘도 안 되는데 다른 방법 더 있을까요??

    0

    645

    1

    인프런 환경이 바뀌어서 제나름대로 하는데

    0

    196

    1

    다시올려주신 예제파일로하는데

    0

    190

    1

    아직도 에러가뜨나보네요?

    0

    584

    1