inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[리뉴얼] 파이썬입문과 크롤링기초 부트캠프 [파이썬, 웹, 데이터 이해 기본까지] (업데이트)

BeautifulSoup 한글깨짐

1330

kennyjeon16

작성한 질문수 5

0

업무 관련 크롤링을 할 겸 관련 페이지에서 크롤링을 할려고 했는데요.

크롤링 시 계속 아무 응답이 없어 구글링 하다, url을 soup 실행시켰는데요.

아래와 같이 일부 문자열이 깨져서 나옵니다. utf-8형태로도 바꿔보았지만 계속 동일 오류가 나는데요 ㅠ

간단하게나마 답변 부탁드립니다 ㅠㅠ

그리고 차단되는 홈페이지는 보통 url 을 실행시키면 <Response [200]> 문구가 아닌

다른 문구형태로 나온다고 알고 있는데요. 전체적으로 실행이 계속 안되는데 혹시 방법이 있을까요?


 

soup = BeautifulSoup(res.text,"html.parser", from_encoding='utf-8')

 

 

웹-크롤링 python

답변 1

0

잔재미코딩 DaveLee

안녕하세요. 답변도우미입니다.

아마 해당 사이트의 인코딩을 정확히 매핑해줘야할 것 같아요.

그런데 인코딩을 정확히 변환시키는 부분이 만만하지 않더라고요.

만약 사이트 크롤링을 막았다면, 아예 데이터가 나오지 않았을 것 같습니다.

비슷하게 시도하신듯 한데요. 다음과 같은 블로그도 참고해보시면 어떠실까요?

https://nan-sso-gong.tistory.com/23

감사합니다.

33강 9:51 excercise55.

0

24

1

섹션2 - 32강 연습문제 48번 질문

0

31

0

주피터 노트북 사용법 강의 관련

0

30

1

exercise 20. 데이터 구조(리스트)

0

32

0

65강 소리

0

37

1

섹션 5 CSS selector사용해서 클로링하기2의 커리큘럼 일정 부재?

0

49

2

크롤링, 영상을 따라해도 제미나에게 물어봐도 안되요

0

54

1

정규표현식 및 여러 코드 꼭 외워야 하나요?

0

60

1

리스트 함수형도 정수 데이터 받을 수 있나요?

0

61

1

크롤링 관련 질문

0

75

1

문제 답이 없는 버전은 없나요?

0

90

1

requests, BeautifulSoup 임포트 부분에 대해 문의드립니다.

0

97

1

업데이트 강의

0

121

2

선생님 강의중에서 sqlite3 강의를 제공한 강의가 있나요?

0

147

2

연습용 예제 파일

0

88

1

lxml 관련 오류

0

118

1

SAVE Request 창 띄우는 법

0

106

1

포스트맨 사용법이 바뀌어서 강의를 따라가지 못하겠습니다. 2

0

90

1

포스트맨 사용법이 바뀌어서 강의를 따라가지 못하겠습니다.

0

116

1

예제 2, 4, 6에 대한 풀이 방식 질문.

0

107

1

문제 파일

0

94

1

pdf 파일 내 코드 복붙시 공백

0

317

1

데이터 저장 강좌 문의 건

0

108

1

" " 와 ' '의 차이를 알고 싶습니다

0

269

1