파이썬 텍스트 분석 입문 - 데이터 수집부터 분석까지
파이썬 텍스트 분석 입문 - 데이터 수집부터 분석까지
수강정보 11명의 수강생
20% 할인, D-22
35,200원
44,000원
지식공유자 : My Incizor
30회 수업 · 총 4시간 20분 수업
기간 : 평생 무제한 시청
수료증 : 발급 강의
수강 난이도 : 초급
지식공유자의 다른 강의 연관 로드맵
아직 다른 강의가 없어요
연관 로드맵이 없어요

이 강의는

본 강의는 파이썬에 대한 기초 문법을 배우신 분들을 대상으로 하며 텍스트 데이터 분석에 사용되는 핵심적인 스킬을 배우게 됩니다. 텍스트 분석에 관심이 있으신 분들이 본 강의를 통해 보다 많은 아이디어를 얻고 두고두고 사용하시길 바랍니다.

누구나 할 수 있는 파이썬 텍스트 분석, 
데이터 수집부터 시각화 & 모델링까지 유용하게!

Text miningData VisualizationTopic Modeling

# 수집부터 분석까지

기초적인 파이썬 지식은 배웠고, 텍스트 마이닝을 해보고 싶은데, 어디서 시작할지 몰라 막막하신가요? 책으로 공부하려 해도, 내용이 이론적이거나 방대한 경우가 많습니다. 그러나 딥러닝 같은 최신 기술을 애써 사용하지 않더라도, 충분히 실용적인 분석을 할 수 있습니다. 본 강의는 기본적이고 활용도가 높은 주제만 골라 데이터 수집부터 분석까지 준비했습니다. 

# 현업 실무자 2명이 구성한 커리큘럼

본 강의는 텍스트 분석을 현업으로 사용하는 실무자 두 명이 함께 제작하였습니다. 강의도 함께 진행합니다. 장단점이 있겠지만, 그 덕분에 강의 자료를 보다 상세하게 만들 수 있었고, 현업에서 실제로 사용해본 기술의 핵심을 전달할 준비가 되었습니다.

# 비전공자도 들을 수 있나요? 🙋🏽‍♀️ 

물론입니다. 본 강의에서 다루는 내용은 알고보면 그리 어려운 내용이 아닙니다. 파이썬 기초 문법만 익히셨다면, 들으실 수 있으나, 부가적인 설명을 위해 약간의 수학 지식을 동원할 수는 있습니다. (로그, 행렬의 곱셈 정도)


이 강의의 구성 📚

텍스트 데이터 수집 ✒️

  • 파이썬으로 웹사이트에서 데이터를 수집하는 방법을 알아봅니다.

키워드 추출 및 워드 클라우드 ✏️

  • 텍스트로부터 키워드를 추출하고, 이를 워드 클라우드로 시각화하는 방법을 배웁니다.

토픽 모델링💡 

  • 문서를 주제에 따라 나누는 방법인 토픽 모델링에 대해 배웁니다.


강의 자료 제공

잘 정리된 자료를 통째로 드립니다.
언제든 필요한 부분만 열어서 보세요.

이런 걸 배워요

  • 파이썬을 이용한 데이터 크롤링
  • 텍스트 데이터 전처리
  • 워드 클라우드를 이용한 키워드 시각화
  • 토픽모델링을 이요한 뉴스 데이터 분류

도움 되는 분들

  • 자연어처리에 관심이 있으신 분
  • 뉴스 데이터를 분석해보고 싶으신 분
  • 실용적인 파이썬 스킬을 배우고 싶으신 분

선수 지식

  • 파이썬 기초 문법
  • 판다스 조금
  • 행렬 곱셈

공개 일자

2020년 11월 18일 (마지막 업데이트 일자 : 2020년 11월 18일)

지식공유자 소개

안녕하세요. 인사이저입니다. 텍스트 데이터를 분석합니다.

https://incizor.com/INTRO

아직 평가를 충분히 받지 못한 강의 입니다.
모두에게 도움이 되는 수강평의 주인공이 되어주세요!😄️️

교육과정

모두 펼치기 30 강의 4시간 20분
섹션 0. 강의소개
4 강의 04 : 37
강의 소개
04 : 37
<실습> 자료 다운로드
<이론> 강의 자료 다운로드
필독!!! - Anaconda 환경 구축 및 konlpy 라이브러리 설치 방법
섹션 1. 크롤링
7 강의 71 : 21
<이론> 크롤링과 우리가 웹 사이트를 보는 방법(html)
11 : 58
<이론> html 호출과 데이터 파싱
19 : 47
<이론> 크롤링의 적법성(1)
09 : 31
<이론> 크롤링의 적법성(2)
11 : 48
<실습> requests 사용하기
08 : 19
<실습> csv 파일 받기
03 : 08
<실습> BeautifulSoup 사용하기
06 : 50
섹션 2. 텍스트 전처리
7 강의 71 : 43
<이론> 텍스트 데이터 처리 OVERVIEW
07 : 59
<이론> 정규 표현식과 re 라이브러리(1)
14 : 23
<이론> 정규 표현식과 re 라이브러리(2)
17 : 03
<이론> 정규 표현식과 re 라이브러리(3)
09 : 08
<이론> 형태소 분석과 불용어 처리 (Konlpy)
09 : 36
<실습> 정규표현식 연습하기
06 : 40
<실습> 문서를 토크 단위로 나누기
06 : 54
섹션 3. 키워드 추출 및 워드 클라우드
6 강의 53 : 48
<이론> 워드 클라우드와 특성 추출
11 : 17
<이론> Bag of Words - 단어의 빈도로 텍스트 표현
09 : 30
<이론> TF-IDF - 해당 표현이 문서에서 얼마나 중요한가
15 : 15
<실습> 워드 클라우드 만들기
09 : 30
<실습> CountVectorizer 사용하기
04 : 34
<실습> TfidfVectorizer 사용하기
03 : 42
섹션 4. 토픽 모델링
6 강의 58 : 46
<이론> 토픽 모델링이란?
13 : 26
<이론> NMF - 음수 미포함 행렬 분해
15 : 17
<실습> 간단한 예제로 NMF 사용법 익히기
06 : 10
<실습> 문서x단어 행렬 분해하기(1)
05 : 29
<실습> 문서x단어 행렬 분해하기(2)
09 : 56
<실습> 날짜x단어 행렬 분해하기
08 : 28
지식공유자 되기
많은 사람들에게 배움의 기회를 주고,
경제적 보상을 받아보세요.
지식공유참여
기업 교육을 위한 인프런
“인프런 비즈니스” 를 통해 모든 팀원이 인프런의 강의들을
자유롭게 학습하는 환경을 제공하세요.
인프런 비즈니스