inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[리뉴얼] 파이썬입문과 크롤링기초 부트캠프 [파이썬, 웹, 데이터 이해 기본까지] (업데이트)

직접 작성해보며 익숙해지기: 크롤링과 전처리 이해하기 (업데이트)

안녕하세요! 질문드립니다.

203

이승현

작성한 질문수 10

0

현재 네이버 국내증시(https://finance.naver.com/sise/)에서

"상승, 하락"파트에 대한 HTML코드는

<img height="6" width="7" alt="하락"src="https://ssl.pstatic.net/static/nfinance/ico_down.gif">

과 같이 나와있는데요,

이렇게 되면 꺽쇄안에 있는 저 "하락"을 가져와야됩니다.

이 상태에서는 

import requests

from bs4 import BeautifulSoup

res = requests.get('https://finance.naver.com/sise/')

soup = BeautifulSoup(res.content, 'html.parser')

data = soup.select("#popularItemList > li ")

for item in data:

    print (item.find('img').get_text())

 

이 코드를 사용해도 에러가 뜨고 "상승", "하락"에 대한 데이터를 수집하지 못합니다.

 

이렇게 꺽쇠<  (여기) > 안에 있는 정보는 어떻게 뽑아올 수 있나요?

웹-크롤링 python

답변 1

0

잔재미코딩 DaveLee

안녕하세요. 말씀하신 부분이 정확히 이해는 안가는데요. 하락 과 상승 이 부분만 따로 뽑아보신다 라는 의미로 이해를 하겠습니다. 이 때에는 영상의 코드를 기반으로 다음과 같이 뽑아보시면 될 것 같습니다. 이외의 img? 이 부분은 개별적으로 특별한 코드를 추가로 뽑아보고 싶으신 것 같아서, 이 부분의 개별적인 코드는 저도 무엇인지 정확하게는 잘 모르겠어서요. 직접 코드를 작성해봐야 할 것 같아요. 보통은 각 태그의 특정 attribute 값은 해당 객체['해당 attribute 이름'] 으로 사전처럼 접근하는 방법도 있기는 합니다. 이 부분은 이런 링크등으로 한번 참고해보시면 어떨까요?

https://hogni.tistory.com/115

https://cosmosproject.tistory.com/273

-------

import requests

from bs4 import BeautifulSoup

res = requests.get('https://finance.naver.com/sise/')

soup = BeautifulSoup(res.content, 'html.parser')

data = soup.select("#popularItemList > li  span.blind")

for item in data:

    print (item.get_text())

섹션2 - 32강 연습문제 48번 질문

0

26

0

주피터 노트북 사용법 강의 관련

0

30

1

exercise 20. 데이터 구조(리스트)

0

32

0

65강 소리

0

34

1

섹션 5 CSS selector사용해서 클로링하기2의 커리큘럼 일정 부재?

0

47

2

크롤링, 영상을 따라해도 제미나에게 물어봐도 안되요

0

52

1

정규표현식 및 여러 코드 꼭 외워야 하나요?

0

58

1

리스트 함수형도 정수 데이터 받을 수 있나요?

0

60

1

크롤링 관련 질문

0

75

1

문제 답이 없는 버전은 없나요?

0

88

1

requests, BeautifulSoup 임포트 부분에 대해 문의드립니다.

0

96

1

업데이트 강의

0

119

2

선생님 강의중에서 sqlite3 강의를 제공한 강의가 있나요?

0

145

2

연습용 예제 파일

0

86

1

lxml 관련 오류

0

117

1

SAVE Request 창 띄우는 법

0

106

1

포스트맨 사용법이 바뀌어서 강의를 따라가지 못하겠습니다. 2

0

90

1

포스트맨 사용법이 바뀌어서 강의를 따라가지 못하겠습니다.

0

112

1

예제 2, 4, 6에 대한 풀이 방식 질문.

0

104

1

문제 파일

0

93

1

pdf 파일 내 코드 복붙시 공백

0

315

1

데이터 저장 강좌 문의 건

0

108

1

" " 와 ' '의 차이를 알고 싶습니다

0

262

1

Exercise 22. 문자열 다루기 (strip)

0

155

1