Thumbnail
BEST
데이터 사이언스 데이터 분석

파이썬 텍스트 분석 입문 - 데이터 수집부터 분석까지 대시보드

(4.7)
13개의 수강평 ∙  299명의 수강생

44,000원

지식공유자: My Incizor
총 30개 수업 (4시간 20분)
수강기한: 
무제한
수료증: 발급
난이도: 
입문
-
초급
-
중급이상
지식공유자 답변이 제공되는 강의입니다
폴더에 추가 공유

초급자를 위해 준비한
[데이터 분석] 강의입니다.

본 강의는 파이썬에 대한 기초 문법을 배우신 분들을 대상으로 하며 텍스트 데이터 분석에 사용되는 핵심적인 스킬을 배우게 됩니다. 텍스트 분석에 관심이 있으신 분들이 본 강의를 통해 보다 많은 아이디어를 얻고 두고두고 사용하시길 바랍니다.

✍️
이런 걸
배워요!
파이썬을 이용한 데이터 크롤링
텍스트 데이터 전처리
워드 클라우드를 이용한 키워드 시각화
토픽모델링을 이용한 뉴스 데이터 분류

누구나 할 수 있는 파이썬 텍스트 분석, 
데이터 수집부터 시각화 & 모델링까지 유용하게!

Text miningData VisualizationTopic Modeling

# 수집부터 분석까지

기초적인 파이썬 지식은 배웠고, 텍스트 마이닝을 해보고 싶은데, 어디서 시작할지 몰라 막막하신가요? 책으로 공부하려 해도, 내용이 이론적이거나 방대한 경우가 많습니다. 그러나 딥러닝 같은 최신 기술을 애써 사용하지 않더라도, 충분히 실용적인 분석을 할 수 있습니다. 본 강의는 기본적이고 활용도가 높은 주제만 골라 데이터 수집부터 분석까지 준비했습니다. 

# 현업 실무자 2명이 구성한 커리큘럼

본 강의는 텍스트 분석을 현업으로 사용하는 실무자 두 명이 함께 제작하였습니다. 강의도 함께 진행합니다. 장단점이 있겠지만, 그 덕분에 강의 자료를 보다 상세하게 만들 수 있었고, 현업에서 실제로 사용해본 기술의 핵심을 전달할 준비가 되었습니다.

# 비전공자도 들을 수 있나요? 🙋🏽‍♀️ 

물론입니다. 본 강의에서 다루는 내용은 알고보면 그리 어려운 내용이 아닙니다. 파이썬 기초 문법만 익히셨다면, 들으실 수 있으나, 부가적인 설명을 위해 약간의 수학 지식을 동원할 수는 있습니다. (로그, 행렬의 곱셈 정도)


이 강의의 구성 📚

텍스트 데이터 수집 ✒️

  • 파이썬으로 웹사이트에서 데이터를 수집하는 방법을 알아봅니다.

키워드 추출 및 워드 클라우드 ✏️

  • 텍스트로부터 키워드를 추출하고, 이를 워드 클라우드로 시각화하는 방법을 배웁니다.

토픽 모델링💡 

  • 문서를 주제에 따라 나누는 방법인 토픽 모델링에 대해 배웁니다.


강의 자료 제공

잘 정리된 자료를 통째로 드립니다.
언제든 필요한 부분만 열어서 보세요.

이런 분들께 추천드려요!

🎓
학습 대상은
누구일까요?
자연어처리에 관심이 있으신 분
뉴스 데이터를 분석해보고 싶으신 분
실용적인 파이썬 스킬을 배우고 싶으신 분
📚
선수 지식,
필요할까요?
파이썬 기초 문법
판다스 조금
행렬 곱셈

안녕하세요
My Incizor 입니다.
My Incizor의 썸네일

안녕하세요. 인사이저입니다. 텍스트 데이터를 분석합니다.

https://incizor.com/INTRO

커리큘럼 총 30 개 ˙ 4시간 20분의 수업
이 강의는 영상, 수업 노트, 첨부 파일, 미션이 제공됩니다. 미리보기를 통해 콘텐츠를 확인해보세요.
섹션 0. 강의소개
강의 소개 미리보기 04:37
<실습> 자료 다운로드
<이론> 강의 자료 다운로드
필독!!! - Anaconda 환경 구축 및 konlpy 라이브러리 설치 방법
섹션 1. 크롤링
<이론> 크롤링과 우리가 웹 사이트를 보는 방법(html) 미리보기 11:58
<이론> html 호출과 데이터 파싱 19:47
<이론> 크롤링의 적법성(1) 09:31
<이론> 크롤링의 적법성(2) 11:48
<실습> requests 사용하기 08:19
<실습> csv 파일 받기 03:08
<실습> BeautifulSoup 사용하기 06:50
섹션 2. 텍스트 전처리
<이론> 텍스트 데이터 처리 OVERVIEW 미리보기 07:59
<이론> 정규 표현식과 re 라이브러리(1) 14:23
<이론> 정규 표현식과 re 라이브러리(2) 17:03
<이론> 정규 표현식과 re 라이브러리(3) 09:08
<이론> 형태소 분석과 불용어 처리 (Konlpy) 09:36
<실습> 정규표현식 연습하기 06:40
<실습> 문서를 토크 단위로 나누기 06:54
섹션 3. 키워드 추출 및 워드 클라우드
<이론> 워드 클라우드와 특성 추출 11:17
<이론> Bag of Words - 단어의 빈도로 텍스트 표현 09:30
<이론> TF-IDF - 해당 표현이 문서에서 얼마나 중요한가 15:15
<실습> 워드 클라우드 만들기 09:30
<실습> CountVectorizer 사용하기 04:34
<실습> TfidfVectorizer 사용하기 03:42
섹션 4. 토픽 모델링
<이론> 토픽 모델링이란? 13:26
<이론> NMF - 음수 미포함 행렬 분해 15:17
<실습> 간단한 예제로 NMF 사용법 익히기 06:10
<실습> 문서x단어 행렬 분해하기(1) 05:29
<실습> 문서x단어 행렬 분해하기(2) 09:56
<실습> 날짜x단어 행렬 분해하기 08:28
강의 게시일 : 2020년 11월 18일 (마지막 업데이트일 : 2020년 11월 18일)
수강평 총 13개
수강생분들이 직접 작성하신 수강평입니다.
4.7
13개의 수강평
5점
4점
3점
2점
1점
VIEW 추천 순 최신 순 높은 평점 순 낮은 평점 순 평점 순 높은 평점 순 낮은 평점 순
kakarote5050 thumbnail
5
이론과 실습을 적정하게 배분해주셔서 실습위주 뿐 아니라 이론적으로도 많은 도움이되는 강의인것 같습니다!
2023-05-29
재클린 thumbnail
5
알기 쉽게 설명을 차근 차근 사례와 함께 해주셔서 궁금증이 한방에 쏴~~악~^^ 감사드려요
2022-01-12
김민규 thumbnail
5
쉽게 알려주셔서 좋았습니다.
2022-01-23
백승휘 thumbnail
5
이론과 실습의 조화
2022-06-29
Johnnie Kim thumbnail
4
쉽게 입문하기에 좋은 강의입니다. 다만 pandas와 numpy에 대한 기초지식도 있어야 실습 강의를 수월하게 따라갈 수 있을 것 같아요.
2022-04-01