• 카테고리

    질문 & 답변
  • 세부 분야

    데이터 분석

  • 해결 여부

    미해결

페이지소스가 달라서 질문드립니다.

20.09.17 07:25 작성 조회수 141

0

안녕하세요, 선생님. 좋은 수업 제공해주셔서 감사합니다. 프로그램 처음 시작해서 48강까지 온 제가 너무 신기하네요.  감사합니다. 다름이 아니라 기사가 업데이트 되었는지, 강의에서 보이는 기사의 페이지소스와 제 크롬에서 보이는 페이지소스가 달라 헷갈려서 질문 드립니다. 기사 입력날짜를 크롤링하려고 아래와 같이 했는데요. 출력이 기사입력날짜, 좋아요,댓글달기, 0,0 등이 나와서요. 어떤 부분을 수정해야할지 잘모르겠습니다.

제가 쓴 코드

import requests

from bs4 import BeautifulSoup

res = requests.get('https://www.hankookilbo.com/News/Read/201706152032519127')

soup = BeautifulSoup(res.content, 'html.parser')

mydata = soup.find_all ('div','info')

for item in mydata :

    print (item.get_text())

제 크롬에서 본 페이지소스

</div>
<h2 class="title">
잔금대출에도 DTI 규제 적용 검토</h2>
<div class="info">
<dl>
<dt>입력</dt>
<dd>2017.06.15 20:09</dd>
</dl>
<div class="tool-bar">
<!-- .tooltip-box -->
<div class="tooltip-box">
<button type="button" class="btn-like-all open-tip">
<span class="blind">좋아요</span>
</button>
<!-- .like-detail -->
<div class="like-detail tooltip">
<ul>
<li class="like" id="likeCntLi">0</li>
<li class="unlike" id="dislikeCntLi">0</li>
</ul>
</div>
<!-- // .like-detail -->
</div>
<!-- // .tooltip-box -->
<span class="count" id="sympathyCntSpan">0</span>
<button type="button" class="btn-comment">
<span class="blind">댓글달기</span>
</button>
<span class="count" id="commentCntSpan">0</span>
</div>
</div>
</div>

답변 3

·

답변을 작성해보세요.

0

hshhs0618님의 프로필

hshhs0618

질문자

2020.09.21

답변 감사합니다~ 선생님. "패턴으로 실습하며 익히기 : HTML/CSS 이해를 바탕으로 크롤링하기" 강좌 보고 질문 드렸었습니다. 질문드리고서 해당 강의 다음에 있는 강의들을 보니, 제 질문에 대한 해답들이 다 있어서 질문 안 드렸어도 될뻔했어요 ㅎㅎㅎ 강의 최고입니다! 감사합니다!

0

ses123you님의 프로필

ses123you

2020.09.17

강의에서 크롤링한 주소가 아니고, 한국일보에서 크롤링하셔서 차이가 있는것 같네요.

제가 도움을 드리자면 아래의 코드를 그대로 해보시면 될거에요..

기존에 작성하신 코드와 비교해 보시면 될듯해요.

import requests

from bs4 import BeautifulSoup

res = requests.get('https://www.hankookilbo.com/News/Read/201706152032519127')

soup = BeautifulSoup(res.content, 'html.parser')

mydata = soup.select_one ('div.info dd')

print (mydata.get_text())

0

안녕하세요. 강의를 잘 들어주셔서 감사합니다. 또 응원합니다.

그런데 크롤링 주소가 이것으로 되어 있고요, 강의 어느 부분에서 어떤 부분을 말씀하시는 것인지 잘 이해가 안가서요. 강의에서는 다음 뉴스를 크롤링하니까요. 

https://www.hankookilbo.com/News/Read/201706152032519127

새로운 질문으로 (댓글에 댓글은 제가 찾기가 어려워서요) 강의 어느 부분에서, 어떤 코드를 가지고, 어떤  부분이 강의와 다르게 동작하는지 한번 확인부탁드려도 될까요???

감사합니다.