• 카테고리

    질문 & 답변
  • 세부 분야

    데이터 엔지니어링

  • 해결 여부

    미해결

후속 강의 선택 문의 드립니다.

20.06.15 13:46 작성 조회수 87

0

안녕하세요. 중급 웹크롤링 강의를 재밌게 잘 듣고 있습니다.

개인적인 목표로, 크롤링 해온 내용들을 KoNLpy 등을 이용해서 분석해보고 싶은 생각이 있는데요

이 경우에는 강사님의 mySQL 강의를 듣는게 좋을지, 아니면 NoSQL을 듣는게 좋을지

추천 부탁드리겠습니다. 둘 다 들으면 좋겠지만 시간이 부족해서요.....

웹크롤링한 내용을 저장해서 분석하기 좋은 툴?을 다루는 강의가 둘 중 어느 것인지 알려주시면

바로 결제해서 이어서 수강하고자 합니다 ㅎㅎ

감사합니다!

답변 1

답변을 작성해보세요.

1

음... 크롤링 데이터라면, mongodb 가 나을 것 같습니다. mongodb는 JSON이 이제 조금 알고 계신 상태니까, JSON 기반으로 처리가 가능해서 유용하고, 크롤링 데이터라면 많은 데이터 중 특정 데이터의 포맷이 잘못되는 경우도 있는데, NoSQL은 이런 경우도 잘 지원을 합니다. 

단, SQL을 기본으로 쌓고, 그 다음에 mongodb 를 들으시는 것이 일반적인 순서이긴 하지만... 시간이 없으시다면, 막바로 mongodb 괜찮습니다. 제 강의에 크롤링해서 mongodb에 넣고, 분석하는 부분(물론 기본 단계)도 보여드리기 때문에,

유용하실 것 같습니다.