데이터 사이언스

/

데이터 분석

따라하며 익히는 크롤링 마스터 with데이터공방

파이썬 크롤링 마스터. 이것 하나면 설치부터 응용까지 한번에. 진짜 활용하는데 꼭 필요한 내용만 꾹꾹 눌러 담았습니다.

(4.5) 수강평 4개

수강생 130명

Thumbnail

유튜브 댓글 크롤링 업데이트

유튜브 댓글 수집하는 부분 변경 안내 드립니다. 

유튜브 댓글 수집시 현재는 아래 로직으로 진행됩니다. 

1. 유튜브 전체 댓글 수 가져오기

2. 최대 횟수(500회)까지 진행하면서, 댓글 스크롤 내리기  → 전체 댓글 수와 일치할 경우 멈추기

제일 처음 가져오는 전체 댓글 수가  대댓글 수만 가져오고, 

아래에서 수집하는 댓글 수는 일반 댓글만 카운트 하는 문제가 있었습니다. 

두 가지 방법으로 접근 가능한데

1. 모든 대댓글을 가져오고 숫자로 카운트 하는방법

이 때에는, "답글 보기" 버튼을 하나씩 클릭하면 대댓글 정보 수집이 가능합니다. 

이렇게 할 경우에는, 하나씩 클릭하고 결과를 기다리는 대기시간도 걸리게 되어 대량의 데이터를 수집하는데 

더 많은 시간이 걸리게 되네요.  

2. 댓글 스크롤을 내리다가,  기존 댓글 수와 차이가 없을 경우 멈추기. 

스크롤을 내려가면서, 댓글 수를 앞서 정리했던 수와 계속 비교를 하고

스크롤 내려도 댓글수가 늘어나지 않는다면 완료되었다 판단.  이 과정을 멈추는 것입니다. 

두 방법의 장단점이 있지만   두 번째 방법이 더 깔끔한 것 같아,  

이 방법으로 가이드를 드리겠습니다. 

해당 강의 자료 게시글(섹션5, 유튜브댓글 수집하기2) 에 코드 자료 업로드 하도록 하겠습니다. 

댓글