inflearn logo
강의

講義

知識共有

[リニューアル] Python入門とクローリング基礎ブートキャンプ [Python、Web、データ理解の基本まで] (アップデート)

クローリングと業務自動化技術:Naver Open API活用、ネイバーショッピングExcelレポート作成

네이버 쇼핑 API 엑셀로 옮길 떄 질문있어요!

801

작성자 없음

投稿した質問数 0

0

안녕하세요. 끝까지 수강하기위해 노력중인 수강생이에요..

마지막갈수록 어려워지는건 기분탓일까요.. 

Open API를 사용해서 랭킹, 제목, 링크까지 뽑아내는건 성공했습니다. 

그런데 동영상 13분 30초에서도 보면 title로 뽑아낸 자료들에 

전부 <b> </b> 태그가 붙는데 이 태그를 없애는 방법이 따로 있나요? 

전에 썼던것 처럼 get_text 이런걸 써주면 해결되는 부분인가요? 

제가 나름대로 get_text 를 써서 리스트 안에 넣어봤는데 안되더라구요. 어찌해야할까요? 

웹-크롤링 python

回答 5

1

SANG HOON HAM

            excel_sheet.append([num, item['title'], item['link']])

이부분에서 그대로 하면 /b 와같은 텍스트도 같이 나오는데 어떻게 하면 필요한 제목만 뽑을 수 있을까요?

0

goldman92

문자열 변경 함수 사용해서 특정 값 제거 할 수 있습니다.

replace("찾을값", "바꿀값")

.replace('<b>', '') 이렇게 해서 ''로 변경하실 수 있습니다.

0

JunHo KANG

저도 같은 고민중인데 혹시 해결하셨다면.. 해결 방법 공유 부탁드립니다 ㅠㅠ

0

SANG HOON HAM

import requests, pprint

import openpyxl

excel_file = openpyxl.Workbook()

excel_sheet = excel_file.active

excel_sheet.column_dimensions['B'].width = 100

excel_sheet.column_dimensions['C'].width = 100

excel_sheet.append(['번호','제목','링크'])

client_id = 'gK2JvAAN997VlvpHrZbV'

client_secret  = 'yXIHkID5kR'

num = 0

for index in range(10):

    start_num = 1 + (index*100)

    naver_open_api = 'https://openapi.naver.com/v1/search/shop.json?query=android&display=100&start' + str(start_num)

    header_params = {'X-Naver-Client-Id': client_id ,'X-Naver-Client-Secret':client_secret}

    res = requests.get(naver_open_api, headers = header_params)

    if res.status_code == 200:

        data = res.json()

        for item in data['items']:

            num += 1

            excel_sheet.append([num, item['title'], item['link']])

    else:

        print('Error:', res.status_code)

excel_file.save('0710연습.xlsx')

excel_file.close()

0

funcoding

안녕하세요. get_text() 로 태그 없이 텍스트만 추출이 가능합니다. 코드를 보여주시면 get_text()로 변경하는 부분도 알려드리겠습니다. 감사합니다.

크롤링, 영상을 따라해도 제미나에게 물어봐도 안되요

0

33

1

정규표현식 및 여러 코드 꼭 외워야 하나요?

0

40

1

리스트 함수형도 정수 데이터 받을 수 있나요?

0

46

1

크롤링 관련 질문

0

64

1

문제 답이 없는 버전은 없나요?

0

74

1

requests, BeautifulSoup 임포트 부분에 대해 문의드립니다.

0

83

1

업데이트 강의

0

98

2

선생님 강의중에서 sqlite3 강의를 제공한 강의가 있나요?

0

123

2

연습용 예제 파일

0

76

1

lxml 관련 오류

0

106

1

SAVE Request 창 띄우는 법

0

92

1

포스트맨 사용법이 바뀌어서 강의를 따라가지 못하겠습니다. 2

0

75

1

포스트맨 사용법이 바뀌어서 강의를 따라가지 못하겠습니다.

0

98

1

예제 2, 4, 6에 대한 풀이 방식 질문.

0

89

1

문제 파일

0

78

1

pdf 파일 내 코드 복붙시 공백

0

291

1

데이터 저장 강좌 문의 건

0

95

1

" " 와 ' '의 차이를 알고 싶습니다

0

243

1

Exercise 22. 문자열 다루기 (strip)

0

132

1

list함수로 리스트 선언하면 실패하는데 이유는 무엇입니까?

0

187

1

셀 삽입후 바로 기입이 가능합니까?

0

139

2

주피터 노트북 마우스 스크롤? 오류

0

1550

2

등호 2개('==')의 의미가 뭐죠?

0

460

2

페이지가 넘어갈 때 url 변하지 않는 경우

0

267

1