Thumbnail
데이터 사이언스 데이터 수집 · 처리
파이썬 텍스트 분석 입문 - 데이터 수집부터 분석까지
(4.6)
8개의 수강평 ∙ 186명의 수강생

44,000원

지식공유자 : My Incizor
총 30개 수업˙총 4시간 20분
평생 무제한 수강
수료증 발급 강의
입문 초급 대상 중급이상
폴더에 추가 377 공유
초급자를 위해 준비한
[데이터 수집 · 처리, 데이터 분석] 강의입니다.

본 강의는 파이썬에 대한 기초 문법을 배우신 분들을 대상으로 하며 텍스트 데이터 분석에 사용되는 핵심적인 스킬을 배우게 됩니다. 텍스트 분석에 관심이 있으신 분들이 본 강의를 통해 보다 많은 아이디어를 얻고 두고두고 사용하시길 바랍니다.

✍️
이런 걸
배워요!
파이썬을 이용한 데이터 크롤링
텍스트 데이터 전처리
워드 클라우드를 이용한 키워드 시각화
토픽모델링을 이용한 뉴스 데이터 분류

누구나 할 수 있는 파이썬 텍스트 분석, 
데이터 수집부터 시각화 & 모델링까지 유용하게!

Text miningData VisualizationTopic Modeling

# 수집부터 분석까지

기초적인 파이썬 지식은 배웠고, 텍스트 마이닝을 해보고 싶은데, 어디서 시작할지 몰라 막막하신가요? 책으로 공부하려 해도, 내용이 이론적이거나 방대한 경우가 많습니다. 그러나 딥러닝 같은 최신 기술을 애써 사용하지 않더라도, 충분히 실용적인 분석을 할 수 있습니다. 본 강의는 기본적이고 활용도가 높은 주제만 골라 데이터 수집부터 분석까지 준비했습니다. 

# 현업 실무자 2명이 구성한 커리큘럼

본 강의는 텍스트 분석을 현업으로 사용하는 실무자 두 명이 함께 제작하였습니다. 강의도 함께 진행합니다. 장단점이 있겠지만, 그 덕분에 강의 자료를 보다 상세하게 만들 수 있었고, 현업에서 실제로 사용해본 기술의 핵심을 전달할 준비가 되었습니다.

# 비전공자도 들을 수 있나요? 🙋🏽‍♀️ 

물론입니다. 본 강의에서 다루는 내용은 알고보면 그리 어려운 내용이 아닙니다. 파이썬 기초 문법만 익히셨다면, 들으실 수 있으나, 부가적인 설명을 위해 약간의 수학 지식을 동원할 수는 있습니다. (로그, 행렬의 곱셈 정도)


이 강의의 구성 📚

텍스트 데이터 수집 ✒️

  • 파이썬으로 웹사이트에서 데이터를 수집하는 방법을 알아봅니다.

키워드 추출 및 워드 클라우드 ✏️

  • 텍스트로부터 키워드를 추출하고, 이를 워드 클라우드로 시각화하는 방법을 배웁니다.

토픽 모델링💡 

  • 문서를 주제에 따라 나누는 방법인 토픽 모델링에 대해 배웁니다.


강의 자료 제공

잘 정리된 자료를 통째로 드립니다.
언제든 필요한 부분만 열어서 보세요.

지식공유자가 알려주는
강의 수강 꿀팁!
🎓
이런 분들께
추천드려요!
자연어처리에 관심이 있으신 분
뉴스 데이터를 분석해보고 싶으신 분
실용적인 파이썬 스킬을 배우고 싶으신 분
📚
선수 지식,
필요한가요?
파이썬 기초 문법
판다스 조금
행렬 곱셈

안녕하세요
My Incizor 입니다.
My Incizor의 썸네일

안녕하세요. 인사이저입니다. 텍스트 데이터를 분석합니다.

https://incizor.com/INTRO

커리큘럼 총 30 개 ˙ 4시간 20분의 수업
이 강의는 영상, 수업 노트, 첨부 파일, 미션이 제공됩니다. 미리보기를 통해 콘텐츠를 확인해보세요.
섹션 0. 강의소개
강의 소개 미리보기 04:37
<실습> 자료 다운로드
<이론> 강의 자료 다운로드
필독!!! - Anaconda 환경 구축 및 konlpy 라이브러리 설치 방법
섹션 1. 크롤링
<이론> 크롤링과 우리가 웹 사이트를 보는 방법(html) 미리보기 11:58
<이론> html 호출과 데이터 파싱 19:47
<이론> 크롤링의 적법성(1) 09:31
<이론> 크롤링의 적법성(2) 11:48
<실습> requests 사용하기 08:19
<실습> csv 파일 받기 03:08
<실습> BeautifulSoup 사용하기 06:50
섹션 2. 텍스트 전처리
<이론> 텍스트 데이터 처리 OVERVIEW 미리보기 07:59
<이론> 정규 표현식과 re 라이브러리(1) 14:23
<이론> 정규 표현식과 re 라이브러리(2) 17:03
<이론> 정규 표현식과 re 라이브러리(3) 09:08
<이론> 형태소 분석과 불용어 처리 (Konlpy) 09:36
<실습> 정규표현식 연습하기 06:40
<실습> 문서를 토크 단위로 나누기 06:54
섹션 3. 키워드 추출 및 워드 클라우드
<이론> 워드 클라우드와 특성 추출 11:17
<이론> Bag of Words - 단어의 빈도로 텍스트 표현 09:30
<이론> TF-IDF - 해당 표현이 문서에서 얼마나 중요한가 15:15
<실습> 워드 클라우드 만들기 09:30
<실습> CountVectorizer 사용하기 04:34
<실습> TfidfVectorizer 사용하기 03:42
섹션 4. 토픽 모델링
<이론> 토픽 모델링이란? 13:26
<이론> NMF - 음수 미포함 행렬 분해 15:17
<실습> 간단한 예제로 NMF 사용법 익히기 06:10
<실습> 문서x단어 행렬 분해하기(1) 05:29
<실습> 문서x단어 행렬 분해하기(2) 09:56
<실습> 날짜x단어 행렬 분해하기 08:28
강의 게시일 : 2020년 11월 18일 (마지막 업데이트일 : 2020년 11월 18일)
수강평 총 8개
수강생분들이 직접 작성하신 수강평입니다. 수강평을 작성 시 300잎이 적립됩니다.
4.6
8개의 수강평
5점
4점
3점
2점
1점
VIEW 좋아요 순 최신 순 높은 평점 순 낮은 평점 순 평점 순 높은 평점 순 낮은 평점 순
ts.gim thumbnail
잘 배웠습니다.
2021-11-26
손명선 thumbnail
쉽고 재미있게 들었습니다.감사합니다.
2021-04-08
Henry Lee thumbnail
독학으로 공부하는 시간을 크게 단축시킬 수 있었던 것 같습니다.
2021-06-16
beam.ch6 thumbnail
텍스트 분석에 대한 기본적인 지식을 얻을 수 있는 좋은 강의였습니다.
2021-01-26
duckgyu.lee thumbnail
많은 도움이 되었습니다.
2021-07-28

44,000원

폴더에 추가 377 공유
지식공유자 : My Incizor
총 30개 수업˙총 4시간 20분
평생 무제한 수강
수료증 발급 강의
입문 초급 대상 중급이상
수강 전 궁금한 점이 있나요?
문의하기
문의
지식공유자 되기
많은 사람들에게 배움의 기회를 주고,
경제적 보상을 받아보세요.
지식공유참여
기업 교육을 위한 인프런
“인프런 비즈니스” 를 통해 모든 팀원이 인프런의 강의를
자유롭게 학습하는 환경을 제공하세요.
인프런 비즈니스