• 카테고리

    질문 & 답변
  • 세부 분야

    데이터 엔지니어링

  • 해결 여부

    미해결

css관련 질문

20.01.16 16:50 작성 조회수 180

0

안녕하세요!

<p>...</p> 안에 있는 모든 텍스트와, 하위 클래스의 텍스트를 가져올려면 어떻게 해야하나요??

#journal_comment_279780214383945048857931676069855610723 > div.little-spaced.mb_10.single_comment_box.show_report_spam_link.cfx > div.correction_list.corner-rounded_5.little-spaced > div:nth-child(3) > ul > li.corrected.correct > p

t감사합니다!

답변 1

답변을 작성해보세요.

0

Howoo Jang님의 프로필

Howoo Jang

2020.01.20

스크래피 다루는 이 강의 말고 전 강의 '파이썬입문과 크롤링기초 부트캠프'로 돌아가셔서 저 부분 참고하세요. 크롬에서 F12 눌러서 CSS SELECTOR 복사 해서 붙여넣기하면 안되는 경우가 훨씬 더 많으니깐, 아래 강의 보시면 차례대로 상위 태그에서 하위 태그로 줌-인해서 원하는거만 빼낼 수 있는 방법 알려줍니다. 하위에서 상위로 가는 반대도 알려주고요.

import requests

from bs4 import BeautifulSoup

html = '<div class = "correction_box"> \

            <ul class = "correction_field"> \

                <li class = "incorrect"> 저는 그다지 잘해서 그린때문에 어느 그림을 사진에</li> \

                <li class = "corrected correct"> \

                    <p>\

                        "저는 그다지 잘" \

                        <span class = "f_gray">...</span> \

                        <span class = "f_red">못</span> \

                        "그"\

                        <span class = "f_gray">...</span> \

                        <span class = "f_red">려서</span> \

                        "어느 그림을 사진에" \

                    </p> \

                </ul> \

        </div>'

    

soup = BeautifulSoup(html, "html.parser")

data= soup.select('ul.correction_field p')

for item in data:

    print(item.get_text().strip())