작성한 질문수
[리뉴얼] 파이썬입문과 크롤링기초 부트캠프 [파이썬, 웹, 데이터 이해 기본까지] (업데이트)
패턴으로 실습하며 익히기: HTML/CSS 이해를 바탕으로 크롤링하기
작성
·
444
0
수업 내용대로 layer_util~ 이 부분을 코드에서 그대로 복사해서 find 함수의 인자에 넣었는데 결과값으로 none이 계속 떴습니다.
그래서 원인을 찾아보고자, 파싱한 soup 변수를 프린트하고 거기서 크롤링하고자 한 본문 내용을 찾아 본문을 포함하는 태그를 확인하니 전혀 다른 클래스 명이 적혀있었습니다.
(아래 사진 참고)
ㅇ아무래도 클래스 명이 바뀌어서 계속 find를 해도 찾을 수가 없었던 것 같은데, 이런 경우가 흔한가요? 이럴 땐 어떻게 대처해야 하나요?
퀴즈
웹 크롤링 과정의 가장 기본적인 3단계는 무엇일까요?
로그인, 탐색, 다운로드
페이지 가져오기, HTML 분석하기, 데이터 추출하기
데이터 수집, 모델 학습, 결과 예측
설치, 설정, 실행
답변 1
이렇게 soup에서 직접 찾은 class명을 사용해서 find를 하니 잘 찾아지긴 했습니다.