• 카테고리

    질문 & 답변
  • 세부 분야

    업무 자동화

  • 해결 여부

    해결됨

데이터스크래핑 질문

22.02.20 02:40 작성 조회수 297

0

안녕하세요.

좋은 강의 열심히 보고 있습니다 :)

 

네이버데이터랩에서 데이터 스크래핑으로 값을 가져오는데 

분명 글자를 지정하였음에도 불구하고 숫자와 같이 긁어와집니다

글자만 가져올 수 있는 방법이 있을까요??

 

 

답변 2

·

답변을 작성해보세요.

1

안녕하세요 moto6434님

해당 사이트의 소스에 a태그(키워드) 내 순위에 대한 구분값(span)은 있지만 '원피스'에 대한 구분 값이 존재 하지 않아 데이터 스크래핑으로 글자만 가져오기 어려워 보입니다.

 

해결방안으로는 키워드(1  원피스) 값을 데이터 스크래핑 후 split을 사용하여 줄바꿈 문자(chr(10))를 구분하여  '1'과 '원피스' 문자를 따로 DT에 저장하는 방법이 있습니다.

1. 데이터 스크래핑으로 키워드(1 원피스) 값 스크래핑

2. DT 테이블(int, str) 생성

3. 줄바꿈 문자(chr(10))로 split하여 DT에 저장

{cint(row(0).tostring.split(chr(10))(0)),row(0).tostring.split(chr(10))(1)}

4. For Each Row로 반복

 

결과입니다.

감사합니다.

moto6434님의 프로필

moto6434

질문자

2022.02.21

감사합니다 두가지 방법 다 시도 해보겠습니다 :)

1

안녕하세요 moto6434 님,

추출할 데이터 영역을 선택하시고, 모든 열을 추출하시겠습니까 라는 알림이 뜨면 아니오 선택 후,

해당 영역을 아래 그림과 같이 글자만 있는 영역만 선택하시면 글자만 가져올 수 있습니다.

감사합니다.

 

moto6434님의 프로필

moto6434

질문자

2022.02.21

감사합니다 두가지 방법 다 시도 해보겠습니다 :)