인프런 영문 브랜드 로고
인프런 영문 브랜드 로고

인프런 커뮤니티 질문&답변

Lean In님의 프로필 이미지
Lean In

작성한 질문수

파이썬 텍스트 분석 입문 - 데이터 수집부터 분석까지

<실습> csv 파일 받기

copy element 하는 경우..

작성

·

277

0

안녕하세요?

csv다운로드 링크로 리퀘스트를 보내니 자꾸 404 오류가 나서 올려주신 코드의 주소와 대조해보았습니다.  저는 copy element로 복사를 했는데, 이때 파라미터 간에 &가 아니라 amp; 로 연결되어 있더라고요. 다른 크롤링 강의에선 copy 메뉴도 사용했던 경우도 있어서 이걸 매번 확인하며 사용하는 것인지 궁금하네요. 

답변 1

1

My Incizor님의 프로필 이미지
My Incizor
지식공유자

안녕하십니까, 인사이저 입니다.

아무래도 copy element 메뉴를 통해 태그를 가져오는 기법은 HTML 정보를 통째로 가져오는 방법이라,

&amp; / &nbsp; / &lt; 등의 html 문법적 표현들도 함께 가져오게 되는 것 같습니다.

만일 저희가 알려드린 방식으로,

copy element가 아닌 직접 값을 클릭->복사 하는 방식으로 URL을 가져오신다면

해당 문제가 발생할 가능성이 낮을 것으로 보이나,

copy element로 HTML 태그를 가져와서 url을 확보하는 방식을 이용하실 경우,

태그를 때는 전처리 작업 포함, 상기의 HTML 문법들을 제거하는 불용어 처리도 함께 진행하셔야 할 것으로 보입니다.

상기의 문법들이 html 상에서 어떤 의미를 지니는 지 설명이 되어있는 블로그 링크도 함께 공유드리겠습니다.

------------------

[HTML-CSS 기초 강좌] &nbsp; &amp; &lt; &gt; &quot; 의 의미와 사용법은?

http://mwultong.blogspot.com/2006/07/html-css-nbsp-amp-lt-gt-quot.html

------------------

감사합니다.

Lean In님의 프로필 이미지
Lean In

작성한 질문수

질문하기