소개
게시글
고민있어요
2021.06.22 23:53
[Hadoop 실행] 명령어
- 0
- 1
- 95
고민있어요
2021.06.22 23:41
[환경변수 설정 후] Warning Message
- 1
- 1
- 142
질문&답변
2021.01.09
엑셀파일로 저장시 오류 문제
파일을 jupyter notebook에서 열지 마시고, 생성된 폴더에 가셔서 열면 됩니다.
- 0
- 3
- 1.1K
질문&답변
2021.01.09
50강 / 7분 14초 / selector
@강호성님 추출조건이 특정 keyword가 들어간 문자열이 아니라 정해진 위치라면.. 인터넷을 뒤져보니 처음 질문하셨던 방법대로 리스트의 몇 번째로 바로 접근하시는 것이 좋지 싶네요. 구글링하다보니 몇 번째 요소에 접근하는 nth-of-type이란 것도 있네요. 덕분에 많이 공부했네요. import requests from bs4 import BeautifulSoup res = requests.get('https://davelee-fun.github.io/blog/crawl_test') soup = BeautifulSoup(res.content, 'html.parser') item = (soup.select_one('ul#hobby_course_list li:nth-of-type(4)')) print(item.get_text())
- 0
- 4
- 222
질문&답변
2021.01.08
50강 / 7분 14초 / selector
아 지금 강의 들으니 select()로 추출하면 좀 더 깔끔하네요. 1. index로 검색 import requests from bs4 import BeautifulSoup res = requests.get('https://davelee-fun.github.io/blog/crawl_test') soup = BeautifulSoup(res.content, 'html.parser') items = soup.select('ul#hobby_course_list li') for index, item in enumerate(items): if index == 0: # 원하는 index를 주면 됨. print(item.get_text()) 2. 원하는 단어로 검색 import requests from bs4 import BeautifulSoup res = requests.get('https://davelee-fun.github.io/blog/crawl_test') soup = BeautifulSoup(res.content, 'html.parser') items = soup.select('ul#hobby_course_list li') for item in items: words = item.get_text().split('-')[1].split() for word in words: if word == "클래스": # 원하는 문자를 주면 됨. print(item.get_text()) 그리고, 그냥 첫번째를 원하시는 거면, 다음 강의에 나오는 select_one 을 사용하시면 되네요. ^^ 강사님 이 글 보실지 모르지만, 강의 감사합니다. 꾸벅
- 0
- 4
- 222