실전크롤링과 강력한 크롤링 기술팁2 버전에서 질문
269
작성한 질문수 15
split함수를 적용해서 실행을 하면 첫줄만 결과값이 나옵니다.
강사님의 코드를 그대로 복사해서 쓴건데 그렇게 나와서
어떤 부분이 잘못된건지 문의드립니다.
캡쳐로 제 컴퓨터에서 강사님 홈페이지 html보이는 부분이랑
제가 파이썬으로 작업한 부분같이 보내드립니다. http://localhost:8888/notebooks/python%20-study/%ED%81%AC%EB%A1%A4%EB%A7%81.ipynb

답변 1
0
안녕하세요.
우선 보내주신 링크는 수강생님의 PC에서만 유효한 링크입니다. 저에게 보여지는 링크는 아니고요.
첫번째 코드와 두번째 코드가 오로지 split 부분만 다른건지 확인이 필요한 것 같습니다. 캡쳐한 부분만으로 보이기에는 split 부분만 다른 것 같기는 한데요. 실제 첫번째코드가 실행했을때, 저렇게 리스트가 나오는데, 여기에 split 만 붙인 두번째 코드가 한줄만 나온다면, 첫번째 코드에 split 을 다 붙이시기보다 우선 split('[')[0] 과 같이 작게 쪼개서 붙여보시면서 테스트해보시면 좋을 것 같습니다.
제공해드린 코드를 그대로 자신이 다른 노트북에 치셨다고 했을 때에도 매우 확인하기 어려운 사소한 실수로, 동일하게 동작을 안하는 경우가 있을 수 있어요. 이 때는 무조건 제가 제공해드린 주피터 노트북 파일을 그대로 실행해보고, 코드를 키보드로 치기보다, 전체를 복사해서, 붙여넣어서, 테스트를 해보시면 좋습니다. 그런 후에 자신의 이전 코드와 제가 드린 코드를 꼼꼼히 비교해보시면서, 어느 부분이 다르게 되어 있는지 확인해보시면 좋습니다. 저에게 그런 부분을 보여주셔도, 저 또한 기존 제 코드와 수강생님의 코드에서 어느 부분이 다른지를 숨은 그림 찾기 하듯이 비교해보는 것인데요.
직접 제가 작성해봤을 때, 본래 강의에서 설명드린 코드와
-----------------
import requests
from bs4 import BeautifulSoup
res = requests.get('https://davelee-fun.github.io/blog/crawl_test')
soup = BeautifulSoup(res.content, 'html.parser')
titles = soup.find_all('li', 'course')
for title in titles:
print(title.get_text())
-----------------
여기에 split 을 넣은 코드 모두 둘다 정상 동작합니다.
------------
import requests
from bs4 import BeautifulSoup
res = requests.get('https://davelee-fun.github.io/blog/crawl_test')
soup = BeautifulSoup(res.content, 'html.parser')
titles = soup.find_all('li', 'course')
for title in titles:
print(title.get_text().split('[')[0].split('-')[1])
------------
33강 9:51 excercise55.
0
24
1
섹션2 - 32강 연습문제 48번 질문
0
31
0
주피터 노트북 사용법 강의 관련
0
30
1
exercise 20. 데이터 구조(리스트)
0
32
0
65강 소리
0
36
1
섹션 5 CSS selector사용해서 클로링하기2의 커리큘럼 일정 부재?
0
49
2
크롤링, 영상을 따라해도 제미나에게 물어봐도 안되요
0
54
1
정규표현식 및 여러 코드 꼭 외워야 하나요?
0
60
1
리스트 함수형도 정수 데이터 받을 수 있나요?
0
61
1
크롤링 관련 질문
0
75
1
문제 답이 없는 버전은 없나요?
0
90
1
requests, BeautifulSoup 임포트 부분에 대해 문의드립니다.
0
97
1
업데이트 강의
0
121
2
선생님 강의중에서 sqlite3 강의를 제공한 강의가 있나요?
0
146
2
연습용 예제 파일
0
88
1
lxml 관련 오류
0
118
1
SAVE Request 창 띄우는 법
0
106
1
포스트맨 사용법이 바뀌어서 강의를 따라가지 못하겠습니다. 2
0
90
1
포스트맨 사용법이 바뀌어서 강의를 따라가지 못하겠습니다.
0
115
1
예제 2, 4, 6에 대한 풀이 방식 질문.
0
107
1
문제 파일
0
93
1
pdf 파일 내 코드 복붙시 공백
0
316
1
데이터 저장 강좌 문의 건
0
108
1
" " 와 ' '의 차이를 알고 싶습니다
0
267
1





