inflearn logo
강의

講義

知識共有

簡単に初めてのPython高度なクロール[Scrapy、Selenium、Headless Chrome]

強力/最新のクロール技術:Scrapy spiderクロールデータ保存技術

강력/최신 크롤링 기술: Scrapy spider 크롤링 데이터 저장 기법

375

jschool01225639

投稿した質問数 3

0

- 본 강의 영상 학습 관련 문의에 대해 답변을 드립니다. (어떤 챕터 몇분 몇초를 꼭 기재부탁드립니다)
- 이외의 문의등은 평생강의이므로 양해를 부탁드립니다
- 현업과 병행하는 관계로 주말/휴가 제외 최대한 3일내로 답변을 드리려 노력하고 있습니다
- 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요.
 
 
강력/최신 크롤링 기술: Scrapy spider 크롤링 데이터 저장 기법 5:38
 
문의드립니다. 화면 대로 해서 csv 파일 저장하였는데 '뚫띯딿????' 이런식으로 엑셀파일이 열립니다. 한글로 하려면 어떻게 해야하나요? 참고로 settings.py 들어가서 'utf-8'도 넣어 놨습니다.

selenium scrapy bigdata 웹-크롤링

回答 3

0

python1828

설정을

FEED_EXPORT_ENCODING = 'utf-8-sig'

이렇게 하니 한글 잘나옵니다. 저도 고생해서, 뒷분들 고생하지 마시라고 알려드립니다!

0

purakong2340

저도 같은 문제가 발생하였는데요.  저의 경우에는 액셀 파일을 메모장으로 열어 다른이름으로저장하면 해결되었습니다. 다른 이름으로저장 할 떄, 인코딩을 UTF-8이 아닌 ANSI로 설정해보세요~

0

funcoding

음.. 우선은 settings 설정 자체가 자신은 정확히 스펠링도 틀리지 않고 넣었는데, 잘못 넣으셨을 수도 있어요.

제가 제공해드린 코드를 그대로 한글자도 바꾸지 않고, 새로 다운받으셔서 실행해보시는것도 추천드리고요 (이후 챕터에 utf-8까지  코드도 있을 것이거든요) 아니시면, 다시한번 설정을 정확히 확인해보시는 것도 어떠실까요?

아니면 한글 처리는 잘되었는데, 엑셀 파일로 오픈하면서, 엑셀에서 잘못 표현이 될 수도 있을 것 같아요. 엑셀파일을 다시 유니코드로 다른 파일로 재저장해보시면 어떠실까요?

한글 문제는 워낙 개별 PC, 각 PC 의 각 프로그램 설정마다 다양한 이슈가 생길 수 있어서. 혹시라도 위와 같은 시도를 해보신 후, 이것도 안되시면 아예 다른 PC서도 한번 해보시면 어떠실까요?

[REST API] data의 교환방식 질문

1

663

1

headless chrome 오류 문의

0

1487

1

Selenium 처리 속도 관련 문의드립니다.

0

1951

1

동적 웹사이트에서 element가 선택되지 않는 문제에 관해 질문드립니다

0

687

1

webdriver manager

0

439

1

__init__() got an unexpected keyword argument 'service' 에러 질문드립니다.

1

11709

1

Jupiter NoteBook 파일과 PDF 파일은 어디서 다운로드 받을 수 있나요?

0

444

1

scrapy option질문

1

244

1

response.css 질문드립니다.

0

369

1

scrapy 크롤링 수행시 ffi.callback() 에러가 발생합니다

0

397

1

selenium으로 여러페이지 수집시 질문

0

381

1

연습6 모범 코드: 로그인 시나리오 해보기

0

270

1

셀레니움 문법 업그레이드 , find_element_by_tag_name 오류

3

2832

1

셀레니움 버전 변경으로 인한 코드 변경

0

1284

1

headless error

0

440

1

질문있습니다!

0

463

1

안녕하세요 선생님! 질문있습니다.

0

233

1

selenium&scrapy문의

0

280

1

아래분(phantele47)과 동일한 문제가 발생해서 문의드립니다.

0

909

6

ip 차단을 피하려면 어떻게 해야 하나요?

0

3358

2

start_urls = ['']가 제공해주신 것과 다르게 작동합니다.

1

284

2

json, data = json.loads(response.body_as_unicode()) 부분에 문제가 있는 것 같습니다.

0

601

3

웹크롤링이 상대방 서버에 부담이 될 때는 어떻게 하나요~?

0

684

1

scrapy 윈도우버전의 설명은 따로 없나요??

0

330

1