Thumbnail
BEST 데이터 사이언스 데이터 분석
파이썬 텍스트 분석 입문 - 데이터 수집부터 분석까지
(4.4)
5개의 수강평 ∙ 112명의 수강생

44,000원

지식공유자 : My Incizor
총 30개 수업˙총 4시간 20분
평생 무제한 수강
수료증 발급 강의
입문 초급 대상 중급이상
내 목록 추가 99 공유
초급자를 위해 준비한
[데이터 분석, 데이터 사이언스] 강의입니다.

본 강의는 파이썬에 대한 기초 문법을 배우신 분들을 대상으로 하며 텍스트 데이터 분석에 사용되는 핵심적인 스킬을 배우게 됩니다. 텍스트 분석에 관심이 있으신 분들이 본 강의를 통해 보다 많은 아이디어를 얻고 두고두고 사용하시길 바랍니다.

✍️
이런 걸
배워요!
파이썬을 이용한 데이터 크롤링
텍스트 데이터 전처리
워드 클라우드를 이용한 키워드 시각화
토픽모델링을 이용한 뉴스 데이터 분류

누구나 할 수 있는 파이썬 텍스트 분석, 
데이터 수집부터 시각화 & 모델링까지 유용하게!

Text miningData VisualizationTopic Modeling

# 수집부터 분석까지

기초적인 파이썬 지식은 배웠고, 텍스트 마이닝을 해보고 싶은데, 어디서 시작할지 몰라 막막하신가요? 책으로 공부하려 해도, 내용이 이론적이거나 방대한 경우가 많습니다. 그러나 딥러닝 같은 최신 기술을 애써 사용하지 않더라도, 충분히 실용적인 분석을 할 수 있습니다. 본 강의는 기본적이고 활용도가 높은 주제만 골라 데이터 수집부터 분석까지 준비했습니다. 

# 현업 실무자 2명이 구성한 커리큘럼

본 강의는 텍스트 분석을 현업으로 사용하는 실무자 두 명이 함께 제작하였습니다. 강의도 함께 진행합니다. 장단점이 있겠지만, 그 덕분에 강의 자료를 보다 상세하게 만들 수 있었고, 현업에서 실제로 사용해본 기술의 핵심을 전달할 준비가 되었습니다.

# 비전공자도 들을 수 있나요? 🙋🏽‍♀️ 

물론입니다. 본 강의에서 다루는 내용은 알고보면 그리 어려운 내용이 아닙니다. 파이썬 기초 문법만 익히셨다면, 들으실 수 있으나, 부가적인 설명을 위해 약간의 수학 지식을 동원할 수는 있습니다. (로그, 행렬의 곱셈 정도)


이 강의의 구성 📚

텍스트 데이터 수집 ✒️

  • 파이썬으로 웹사이트에서 데이터를 수집하는 방법을 알아봅니다.

키워드 추출 및 워드 클라우드 ✏️

  • 텍스트로부터 키워드를 추출하고, 이를 워드 클라우드로 시각화하는 방법을 배웁니다.

토픽 모델링💡 

  • 문서를 주제에 따라 나누는 방법인 토픽 모델링에 대해 배웁니다.


강의 자료 제공

잘 정리된 자료를 통째로 드립니다.
언제든 필요한 부분만 열어서 보세요.

지식공유자가 알려주는
강의 수강 꿀팁!
🎓
이런 분들께
추천드려요!
자연어처리에 관심이 있으신 분
뉴스 데이터를 분석해보고 싶으신 분
실용적인 파이썬 스킬을 배우고 싶으신 분
📚
선수 지식,
필요한가요?
파이썬 기초 문법
판다스 조금
행렬 곱셈

안녕하세요
My Incizor 입니다.
My Incizor의 썸네일

안녕하세요. 인사이저입니다. 텍스트 데이터를 분석합니다.

https://incizor.com/INTRO

커리큘럼 총 30개 ˙ 4시간 20분의 수업
이 강의는 영상, 수업 노트, 첨부 파일, 미션이 제공됩니다. 미리보기를 통해 콘텐츠를 확인해보세요.
섹션 0. 강의소개
강의 소개 미리보기 04:37
<실습> 자료 다운로드
<이론> 강의 자료 다운로드
필독!!! - Anaconda 환경 구축 및 konlpy 라이브러리 설치 방법
섹션 1. 크롤링
<이론> 크롤링과 우리가 웹 사이트를 보는 방법(html) 미리보기 11:58
<이론> html 호출과 데이터 파싱 19:47
<이론> 크롤링의 적법성(1) 09:31
<이론> 크롤링의 적법성(2) 11:48
<실습> requests 사용하기 08:19
<실습> csv 파일 받기 03:08
<실습> BeautifulSoup 사용하기 06:50
섹션 2. 텍스트 전처리
<이론> 텍스트 데이터 처리 OVERVIEW 미리보기 07:59
<이론> 정규 표현식과 re 라이브러리(1) 14:23
<이론> 정규 표현식과 re 라이브러리(2) 17:03
<이론> 정규 표현식과 re 라이브러리(3) 09:08
<이론> 형태소 분석과 불용어 처리 (Konlpy) 09:36
<실습> 정규표현식 연습하기 06:40
<실습> 문서를 토크 단위로 나누기 06:54
섹션 3. 키워드 추출 및 워드 클라우드
<이론> 워드 클라우드와 특성 추출 11:17
<이론> Bag of Words - 단어의 빈도로 텍스트 표현 09:30
<이론> TF-IDF - 해당 표현이 문서에서 얼마나 중요한가 15:15
<실습> 워드 클라우드 만들기 09:30
<실습> CountVectorizer 사용하기 04:34
<실습> TfidfVectorizer 사용하기 03:42
섹션 4. 토픽 모델링
<이론> 토픽 모델링이란? 13:26
<이론> NMF - 음수 미포함 행렬 분해 15:17
<실습> 간단한 예제로 NMF 사용법 익히기 06:10
<실습> 문서x단어 행렬 분해하기(1) 05:29
<실습> 문서x단어 행렬 분해하기(2) 09:56
<실습> 날짜x단어 행렬 분해하기 08:28
강의 게시일 : 2020년 11월 18일 (마지막 업데이트일 : 2020년 11월 18일)
수강평 총 5개
수강생분들이 직접 작성하신 수강평입니다. 수강평을 작성 시 300잎이 적립됩니다.
4.4
5개의 수강평
5점
4점
3점
2점
1점
VIEW 좋아요 순 최신 순 높은 평점 순 낮은 평점 순 평점 순 높은 평점 순 낮은 평점 순
kysung thumbnail
Text 분석 이론을 학습하기 유용합니다. 다만 Python 초급자가 강의를 들으면서 실제 분석을 시도해보기에는 실습 부분 설명이 상세하지 않고 다소 속도가 빠른 편입니다.
2021-01-21
jhyun007 thumbnail
텍스트 마이닝 관련 흥미있는 강의입니다....
2020-12-16
조현일 thumbnail
워드클라우드와 토픽모델링에 관련하여 유투브 영상을 찾다가 영상이 너무 길고 지루하여 찾다가 인프런 강의를 수강했어요. 짧은 시간에 제가 알고 싶은 부분만 수강할 수 있어서 너무 좋았습니다. Konlpy 설치하는데 애를 먹고 Mecab()이 자꾸 에러가 나서 Kkma()로 실습진행했어요. 그래서 그런지 news["text"]를 fit_transfor을 할때 시간이 너무 많이 걸렸어요 그것 때문에 그런 건지 궁금합니다.
2020-12-26
지식공유자My Incizor
수강평 감사합니다. 형태소 분석기를 비교한 글들을 보면 Kkma는 분석 개수가 늘어날수록 시간이 크게 늘어나는 것으로 나타납니다. Mecab 설치는 필요할 때 다시 도전해보셔도 좋을 것 같습니다^^ 참고: https://konlpy.org/en/latest/morph/#comparison-between-pos-tagging-classes
2020-12-28
beam.ch6 thumbnail
텍스트 분석에 대한 기본적인 지식을 얻을 수 있는 좋은 강의였습니다.
2021-01-26
손명선 thumbnail
쉽고 재미있게 들었습니다.감사합니다.
2021-04-08

44,000원

내 목록 추가 99 공유
지식공유자 : My Incizor
총 30개 수업˙총 4시간 20분
평생 무제한 수강
수료증 발급 강의
입문 초급 대상 중급이상
수강 전 궁금한 점이 있나요?
문의하기
문의
지식공유자 되기
많은 사람들에게 배움의 기회를 주고,
경제적 보상을 받아보세요.
지식공유참여
기업 교육을 위한 인프런
“인프런 비즈니스” 를 통해 모든 팀원이 인프런의 강의를
자유롭게 학습하는 환경을 제공하세요.
인프런 비즈니스