Thumbnail
데이터 사이언스 데이터 분석

텍스트마이닝 실전 프로젝트 - 뉴스 데이터 분석하기 대시보드

(3.3)
4개의 수강평 ∙  146명의 수강생

33,000원

지식공유자: 코코
총 14개 수업 (3시간 16분)
수강기한: 
무제한
수료증: 발급
난이도: 
입문
-
초급
-
중급이상
지식공유자 답변이 제공되는 강의입니다
폴더에 추가 공유

중급자를 위해 준비한
[데이터 분석] 강의입니다.

프로그래밍 기초적인 지식도 배웠고 크롤링도 배웠고 텍스트 마이닝 강의도 들었는데, 실제로 프로젝트 하면 막막하셨나요? 저와 함께 프로젝트를 처음부터 끝까지 진행해 보는 강의입니다.

✍️
이런 걸
배워요!
뉴스 데이터 분석
Top keyword 시각화
word2vec
추천 및 검색 시스템

🙆🏻‍♀ 텍스트 마이닝 실전 프로젝트 입니다. 뉴스 데이터 수집부터 월별 탑키워드 추출 및 시각화 그리고 뉴스추천 시스템까지 만들어보는 강의입니다!!🙆🏻‍♂

🗒 강의소개

 프로그래밍 기초적인 지식도 배웠고 크롤링도 배웠고 텍스트 마이닝 강의도 들었는데, 실제로 프로젝트 하면 막막하셨나요? 저와 함께 프로젝트를 처음부터 끝까지 진행해 보는 강의입니다.  이 강의에서는 다음과 같은 내용을 다룹니다.

🌈 뉴스데이터 수집 

네이트 뉴스에서 전체 카테고리에 대하여 2019년 일별로 기사 400개씩을 수집합니다.

🌈 뉴스데이터 전처리 및 탑키워드 추출 

네이트 뉴스에서 전체 카테고리에 대하여 2019년 일별로 기사 400개씩을 수집합니다.

🌈 엑셀로 Top keyword 시각화

일별/월별 탑키워드를 엑셀로 시각화 시켜봅니다

🌈 차트로 Top keyword 시각화

네이트 뉴스에서 전체 카테고리에 대하여 2019년 일별로 기사 400개씩을 수집합니다.

🌈 Word2vec 

Word reprensentation의 기본적으로 널리 많이 쓰이는 방법은 'word2vec'의 개념에 대해서 배우고 뉴스데이터로 학습을 시켜 봅니다.

🌈 검색 및 추천 모델 만들기

뉴스의 title을 sentence vec를 만들어 cosine 유사도를 이용하여 뉴스 검색 추천 모델을 만듭니다.

🙋🏻‍♂️ 궁금해요!

Q. R을 아예 몰라도 들을 수 있나요
A. R언어에 대한 기초적인 지식과 웹크롤링, 텍스트마이닝에 대한 기초적인 지식이 있으셔야 듣기 수월하십니다. ㅠㅠ. 제가 올린 R프로그래밍 기초강의(무료)와 텍스트마이닝 강의는 수강하고 들으시는걸 권장해 드립니다. 

이런 분들께 추천드려요!

🎓
학습 대상은
누구일까요?
텍스트 마이닝 프로젝트 해보고 싶으신분
뉴스데이터 분석하고 싶으신 분
📚
선수 지식,
필요할까요?
R프로그래밍
웹크롤링
텍스트마이닝 기초지식

안녕하세요
코코 입니다.
코코의 썸네일

학부에서는 통계학을 전공하고 산업공학(인공지능) 박사를 받고 여전히 공부중인 백수입니다.

 

수상

ㆍ 제6회 빅콘테스트 게임유저이탈 알고리즘 개발 / 엔씨소프트상(2018)

ㆍ 제5회 빅콘테스트 대출 연체자 예측 알고리즘개발 / 한국정보통신진흥협회장상(2017)

ㆍ 2016 날씨 빅데이터 콘테스트/ 기상산업 진흥원장상(2016) 

ㆍ 제4회 빅콘테스트 보험사기 예측 알고리즘 개발 / 본선진출(2016)

ㆍ 제3회 빅콘테스트 야구 경기 예측 알고리즘 개발 / 미래창조과학부 장관상(2015)

* blog : https://bluediary8.tistory.com

주로 연구하는 분야는 데이터 사이언스, 강화학습, 딥러닝 입니다.

크롤링과 텍스트마이닝은 현재는 취미로 하고있습니다 :) 

크롤링을 이용해서 인기있는 커뮤니티 글만 수집해서 보여주는 마롱이라는 앱을 개발하였고

전국의 맛집리스트와 블로그를 수집해서 맛집 추천 앱도 만들었었죠 :) (시원하게 말아먹..)

지금은 인공지능을 연구하는 박사과정생입니다.

 

 

 

 

커리큘럼 총 14 개 ˙ 3시간 16분의 수업
이 강의는 영상, 첨부 파일이 제공됩니다. 미리보기를 통해 콘텐츠를 확인해보세요.
섹션 0. 오리엔테이션
섹션 1. 데이터 전처리 및 탑키워드 추출
2019년 전체 news 데이터 크롤링 미리보기 08:46
전처리 및 탑키워드 추출 29:00
워드클라우드 그리기 04:32
[참고] 네이트 뉴스 수집 (웹크롤링실전편강의) 17:46
섹션 2. 키워드 엑셀로 시각화하기
일별 키워드 엑셀로 시각화 25:56
월별 키워드 정제 10:45
월별 키워드 엑셀로 시각화 09:20
월별 키워드 엑셀로 시각화(중요단어만) 10:38
섹션 3. 차트 시각화
월별 키워드 차트 시각화 18:46
섹션 4. 검색 및 추천 모델 만들기
word2vec 개념 10:16
뉴스데이터 word2vec학습시키기 17:52
뉴스 기사 제목 SentenceVector만들기 10:31
검색 추천 모델 만들기 17:20
강의 게시일 : 2020년 01월 07일 (마지막 업데이트일 : 2020년 01월 07일)
수강평 총 4개
수강생분들이 직접 작성하신 수강평입니다.
3.3
4개의 수강평
5점
4점
3점
2점
1점
VIEW 추천 순 최신 순 높은 평점 순 낮은 평점 순 평점 순 높은 평점 순 낮은 평점 순
김태환 thumbnail
3
그냥그래요
2020-09-07
임동현 thumbnail
4
좋은 강의였습니다.
2020-10-28
dgdg dgdg thumbnail
5
네트워크분석으로 도움많이 받아서 구입 많이했습니다 많은 강의가 더생기면 좋겠습니다
2020-09-24
cgkim thumbnail
1
강의 내용이나 강의자의 딕션이 매우 좋지 못합니다. Word2Vec 부분은 소스도 올려주지 않았군요. 강의를 미리 준비하지 않고 즉흥적으로 진행하다보니 강의 자체가 정돈되지 못한 모습입니다. 그리고 이 분 강의내용을 텍스트로 만들어서 빈도분석을 하면 아마도 '자~' 라는 말이 1위를 할 듯 한데요. 듣기 거슬립니다.
2021-03-07
연관 로드맵
이 강의가 포함된 잘 짜여진 로드맵을 따라 학습해 보세요!