inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[리뉴얼] 파이썬입문과 크롤링기초 부트캠프 [파이썬, 웹, 데이터 이해 기본까지] (업데이트)

시코 홈페이지 게시판 크롤링 관련하여 질문있습니다.

212

갱비니

작성한 질문수 1

0

 

안녕하세요. 강사님. 평소에 열심히 강의를 듣고 있습니다. 현재 시코 홈페이지 게시판 크롤링부분을 듣고 있습니다.

위 사진은 현재 시코 홈페이지의 뉴스의 첫 게시물 제목인 '탄소 발자국을 줄이는 나이키 신발'을 크롤링하기 위해서 select만 한 후 출력한 사진입니다.

아래사진은 이후에  get_text로 문자들만 추출한 사진입니다.

위에서 b라는 하위태그 사이에 있는 1과 </span>태그 와 제목사이에 있는 공백도 같이 추출된 것 같습니다.

결론적으로 궁금한 것은, 강사님께서 하위태그를 출력하는 방법은 알려주셔서 알고 있지만, 위처럼 a태그 안에 추출하고 싶은 것이 있을 때, 일부 a 안에 하위태그의 문자는 추출하지 않도록 설정하는 코딩 방법이 있을까요? ㅠ

뒷 강의에서 나올 수도 있을 것 같긴한데 너무 궁금해서요.. 

장황한 질문 읽어주셔서 감사합니다. 오늘 하루도 즐거운 하루 되시길 바랍니다.

python 웹-크롤링

답변 1

1

잔재미코딩 DaveLee

안녕하세요. 이 부분은 다음 강좌를 보시면서, strip(), split() 함수를 사용해보시면 해결할 수 있을 것 같습니다. 감사합니다.~

실전 크롤링과 강력한 크롤링 기술 팁2 (2020 업데이트)

크롤링, 영상을 따라해도 제미나에게 물어봐도 안되요

0

33

1

정규표현식 및 여러 코드 꼭 외워야 하나요?

0

40

1

리스트 함수형도 정수 데이터 받을 수 있나요?

0

46

1

크롤링 관련 질문

0

64

1

문제 답이 없는 버전은 없나요?

0

74

1

requests, BeautifulSoup 임포트 부분에 대해 문의드립니다.

0

83

1

업데이트 강의

0

98

2

선생님 강의중에서 sqlite3 강의를 제공한 강의가 있나요?

0

123

2

연습용 예제 파일

0

76

1

lxml 관련 오류

0

106

1

SAVE Request 창 띄우는 법

0

92

1

포스트맨 사용법이 바뀌어서 강의를 따라가지 못하겠습니다. 2

0

75

1

포스트맨 사용법이 바뀌어서 강의를 따라가지 못하겠습니다.

0

98

1

예제 2, 4, 6에 대한 풀이 방식 질문.

0

89

1

문제 파일

0

78

1

pdf 파일 내 코드 복붙시 공백

0

291

1

데이터 저장 강좌 문의 건

0

95

1

" " 와 ' '의 차이를 알고 싶습니다

0

243

1

Exercise 22. 문자열 다루기 (strip)

0

132

1

list함수로 리스트 선언하면 실패하는데 이유는 무엇입니까?

0

187

1

셀 삽입후 바로 기입이 가능합니까?

0

139

2

주피터 노트북 마우스 스크롤? 오류

0

1550

2

등호 2개('==')의 의미가 뭐죠?

0

460

2

페이지가 넘어갈 때 url 변하지 않는 경우

0

267

1