• 카테고리

    질문 & 답변
  • 세부 분야

    데이터 분석

  • 해결 여부

    미해결

#의 여부에 따라 크롤링 성공 여부??

20.10.25 14:18 작성 조회수 194

1

안녕하세요~ 선생님의 명강의를 들으며 감사함에 매일 눈물 흘리는 대학생입니다 ㅠㅠ 교수님의 넘치는 사랑으로 더 넘쳐버린 과제들에 치여서 과제에 머리가 터질 것 같았는데,, 잔코 영상 정주행하면서 과제 제작시간이 절반으로 줄어든 것 같아요. 

서두가 길었네요! 궁금한 부분이 있습니다. 

강의제목 : "바로 실전 크롤링해보기: 네이버 주식 사이트 크롤링하기"

강의시간 : 3분 34초 쯤

질문 내용 : 제가 첨부한 사진에서, 보라색 원으로 두 곳을 칠해두었습니다. 위의 원은 #을 넣어야만 아웃풋이 나오고, 아래의 원은 #을 빼야만 아웃풋이 나오더라구요. 반대로 위의 원에서 #을 빼고 아래 원에 #을 넣으면 아웃풋이 안나옵니다. 

이유가 무엇일까요?? 바쁘시겠지만 알려주시면 정말 감사하겠습니다 =))

과제에 치여서 죽어가는 저를 살려주셔서 다시 한 번 감사합니다.. 방학 되면 잔코의 다른 강의들도 다 들을게요!~!

첫 원의 코드

from bs4 import BeautifulSoup

import requests

res = requests.get('https://finance.naver.com/')

soup=BeautifulSoup(res.content, 'html.parser')

data = soup.select('#_topItems1 > tr > th > a')  

for item in data:

    print(item.get_text())

두번째 원의 코드

from bs4 import BeautifulSoup

import requests

res = requests.get('https://finance.naver.com/')

soup=BeautifulSoup(res.content, 'html.parser')

data = soup.select('div.aside_area.aside_stock > table > tbody > tr> th > a')  

for item in data:

    print(item.get_text())

답변 2

·

답변을 작성해보세요.

0

j smile님의 프로필

j smile

질문자

2020.10.26

네 제가 너무 바빠서 급한 불(과제)을 빨리 끌 수 있는 부분들만 골라서 보다보니 이런 문제가 생긴 것 같네요 ㅠ 앞부분에서 알려주신 내용이라니 변명 거리가 없습니다 ㅠ 알려주셔서 감사합니다 오늘도 즐거운 코~딩~

0

안녕하세요. 질문에 이렇게 칭찬을 해주시니, ㅎㅎ 응원톤같은 느낌도 들고 부끄럽습니다.

#으로 시작하는 것은 id를 의미합니다. #이 없는 것은 태그를 의미하고, . 이 붙은 것은 class 를 의미합니다. 

<div id='test'>  <=== #id 또는 div#id

<div class='aside_area'>  <=== div.aside_area 

이 부분은 이미 전 강좌에서 설명을 드린 부분인데요. 전혀 생각이 안나신다면, 아마도 너무 급한 마음에 빠르게 훑었기 때문이 아닐까 생각이 들어요. 프로그래밍은 내 것으로 특정 기술을 만드는데, 일정한 시간이 걸립니다. 다시 한번 기존 영상을 봐보시면 또 이해하실 꺼예요.

감사합니다.