BeautifulSoup 한글깨짐
1330
작성한 질문수 5
업무 관련 크롤링을 할 겸 관련 페이지에서 크롤링을 할려고 했는데요.
크롤링 시 계속 아무 응답이 없어 구글링 하다, url을 soup 실행시켰는데요.
아래와 같이 일부 문자열이 깨져서 나옵니다. utf-8형태로도 바꿔보았지만 계속 동일 오류가 나는데요 ㅠ
간단하게나마 답변 부탁드립니다 ㅠㅠ

그리고 차단되는 홈페이지는 보통 url 을 실행시키면 <Response [200]> 문구가 아닌
다른 문구형태로 나온다고 알고 있는데요. 전체적으로 실행이 계속 안되는데 혹시 방법이 있을까요?
soup = BeautifulSoup(res.text,"html.parser", from_encoding='utf-8')
답변 1
0
안녕하세요. 답변도우미입니다.
아마 해당 사이트의 인코딩을 정확히 매핑해줘야할 것 같아요.
그런데 인코딩을 정확히 변환시키는 부분이 만만하지 않더라고요.
만약 사이트 크롤링을 막았다면, 아예 데이터가 나오지 않았을 것 같습니다.
비슷하게 시도하신듯 한데요. 다음과 같은 블로그도 참고해보시면 어떠실까요?
https://nan-sso-gong.tistory.com/23
감사합니다.
33강 9:51 excercise55.
0
24
1
섹션2 - 32강 연습문제 48번 질문
0
31
0
주피터 노트북 사용법 강의 관련
0
30
1
exercise 20. 데이터 구조(리스트)
0
32
0
65강 소리
0
37
1
섹션 5 CSS selector사용해서 클로링하기2의 커리큘럼 일정 부재?
0
49
2
크롤링, 영상을 따라해도 제미나에게 물어봐도 안되요
0
54
1
정규표현식 및 여러 코드 꼭 외워야 하나요?
0
60
1
리스트 함수형도 정수 데이터 받을 수 있나요?
0
61
1
크롤링 관련 질문
0
75
1
문제 답이 없는 버전은 없나요?
0
90
1
requests, BeautifulSoup 임포트 부분에 대해 문의드립니다.
0
97
1
업데이트 강의
0
121
2
선생님 강의중에서 sqlite3 강의를 제공한 강의가 있나요?
0
147
2
연습용 예제 파일
0
88
1
lxml 관련 오류
0
118
1
SAVE Request 창 띄우는 법
0
106
1
포스트맨 사용법이 바뀌어서 강의를 따라가지 못하겠습니다. 2
0
90
1
포스트맨 사용법이 바뀌어서 강의를 따라가지 못하겠습니다.
0
116
1
예제 2, 4, 6에 대한 풀이 방식 질문.
0
107
1
문제 파일
0
94
1
pdf 파일 내 코드 복붙시 공백
0
317
1
데이터 저장 강좌 문의 건
0
108
1
" " 와 ' '의 차이를 알고 싶습니다
0
269
1





