inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

파이썬 텍스트 분석 입문 - 데이터 수집부터 분석까지

<실습> csv 파일 받기

copy element 하는 경우..

300

Lean In

작성한 질문수 2

0

안녕하세요?

csv다운로드 링크로 리퀘스트를 보내니 자꾸 404 오류가 나서 올려주신 코드의 주소와 대조해보았습니다.  저는 copy element로 복사를 했는데, 이때 파라미터 간에 &가 아니라 amp; 로 연결되어 있더라고요. 다른 크롤링 강의에선 copy 메뉴도 사용했던 경우도 있어서 이걸 매번 확인하며 사용하는 것인지 궁금하네요. 

웹-크롤링 pandas anaconda 텍스트마이닝

답변 1

1

My Incizor

안녕하십니까, 인사이저 입니다.

아무래도 copy element 메뉴를 통해 태그를 가져오는 기법은 HTML 정보를 통째로 가져오는 방법이라,

&amp; / &nbsp; / &lt; 등의 html 문법적 표현들도 함께 가져오게 되는 것 같습니다.

만일 저희가 알려드린 방식으로,

copy element가 아닌 직접 값을 클릭->복사 하는 방식으로 URL을 가져오신다면

해당 문제가 발생할 가능성이 낮을 것으로 보이나,

copy element로 HTML 태그를 가져와서 url을 확보하는 방식을 이용하실 경우,

태그를 때는 전처리 작업 포함, 상기의 HTML 문법들을 제거하는 불용어 처리도 함께 진행하셔야 할 것으로 보입니다.

상기의 문법들이 html 상에서 어떤 의미를 지니는 지 설명이 되어있는 블로그 링크도 함께 공유드리겠습니다.

------------------

[HTML-CSS 기초 강좌] &nbsp; &amp; &lt; &gt; &quot; 의 의미와 사용법은?

http://mwultong.blogspot.com/2006/07/html-css-nbsp-amp-lt-gt-quot.html

------------------

감사합니다.

jpype 설치관련

0

1844

2

Konlpy 설치

0

1004

2

Konlpy 설치 페이지에서 jpype 설치 링크

0

390

1

맥 os에서 폰트 경로 지정*코랩 사용

0

1266

1

Re. Konlpy 설치오류(Okt 오류)

0

1599

1

Konlpy 설치 오류

0

3852

1

tfidf 관련

0

529

1

TF-IDF 질문입니다.

0

554

1

토픽모델링 날짜 관련 오류

0

272

1

질문드립니다.

0

352

1

워드클라우드 plt.subplot 질문

0

325

1

p54 문의드립니다

0

197

1

문의드립니다.

0

1057

1

문의드립니다

0

217

1

p55 문의드립니다

0

228

1

mecab 설치 오류

0

476

1

mecab 설치 오류

0

1375

1

가이드 53페이지 질문(konlpy 파일 없음)

0

290

1

konlpy 설치 오류

0

630

1

jpype 설치 오류

0

280

1

wordcloud image mask가 적용이 안됩니다.

0

1288

1

wordcloud 설치가 안됩니다

0

275

1

가상환경 3.7.11로 설치한 가상환경을 conda info로 확인한 버전과 python --version으로 확인한 버전과 다릅니다.

0

671

1

p.45 konlpy 설치 확인단계에서 오류가 발생합니다.

0

6081

4