• 카테고리

    질문 & 답변
  • 세부 분야

    풀스택

  • 해결 여부

    해결됨

일급(first) 함수 관련 문의 - 크롤링 부분.

20.09.08 19:24 작성 조회수 238

0

안녕하세요 강사님. 

크롤링 결과가 강사님과 다르게 나와서 문의 드립니다.

제 결과는 모든 단어가 한글자씩 분리되어 출력됩니다.

그래서 data_list_minus(['안녕', '하세요']), data_list_minus('안녕') 의 결과가 다른것과 동일한 패턴이 있어서 문의 드립니다. 확인 부탁드립니다.

감사합니다.

크롤링 결과는 아래와 같습니다.

답변 1

답변을 작성해보세요.

0

안녕하세요. 알려주셔서 감사합니다.

문자열 리스트를 data_list_minus() 함수에 넘겨줘야 하는데,  문자열 자체를 넘겨줘서 문자열 자체를 리스트로 분리하는 바람에 말씀하시는 부분과 같이 출력이 되었고, 수정한 다음 코드로 자료도 업데이트해놓겠습니다.

감사합니다.

import requests

from bs4 import BeautifulSoup

res = requests.get('https://davelee-fun.github.io/blog/crawl_html_css.html')

soup = BeautifulSoup(res.content, 'html.parser')

# a 태그이면서 href 속성 값이 특정한 값을 갖는 경우 탐색

link_titles = soup.select("ul#hobby_course_list > li")

data = list()

for link_title in link_titles:

    data.append(link_title.get_text())

data_list_minus(data)