성장의 계절, 모든 강의 30% 할인!

Thumbnail
BEST
데이터 사이언스 데이터 분석

[NLP] IMDB 영화리뷰 감정 분석을 통한 파이썬 텍스트 분석과 자연어 처리 대시보드

(4.6)
41개의 수강평 ∙  2,765명의 수강생
공개되지 않은 강의로
수강이 제한됩니다.
지식공유자: 박조은
총 17개 수업 (3시간 30분)
수강기한: 
무제한
수료증: 발급
난이도: 
입문
-
초급
-
중급이상
지식공유자 답변: 미제공

중급자를 위해 준비한
[데이터 분석, 인공지능] 강의입니다.

캐글에 있는 IMDB 영화리뷰 감정 분석 경진대회를 통해 자연어 처리에 필요한 기초 이론과 실습을 해보는 강의입니다.

✍️
이런 걸
배워요!
자연어처리(NLP)
텍스트 데이터 전처리(정규화, 토큰화, 어근화, 형태소 분석, 어간 추출, 음소 표기법)
텍스트 데이터 시각화 기법(Matplotlib, Seaborn), 머신러닝(Scikit-learn)
딥러닝/머신러닝, 데이터 분석
파이썬 표준 라이브러리를 통한 간단한 퍼셉트론 구현
온라인 러닝, Vowpal Wabbit 개념
다양한 텍스트 데이터 벡터화 기법(Bag of Words, n-gram, TF-IDF, Word2Vec)
파이프라인 구현을 통해 성능 최적화
앙상블(Random Forest)과 부스팅(Xgboost) 기법

영화 리뷰로 보는 머신러닝 감성 분석 🎞️
데이터 전처리부터 평가, 예측까지!

자연어처리 이론과 실습을
한번에 배우고 싶다면? 👩‍💻

이 강의는 캐글(Kaggle)에 있는 IMDB 영화리뷰 감정 분석 경진대회를 통해 자연어 처리에 필요한 기초 이론과 실습을 해보는 수업입니다. 자연어 처리는 챗봇, 텍스트분석뿐만 아니라 머신러닝/딥러닝 모델 개발 시의 데이터 전처리 과정에서 널리 사용됩니다. 

자연어처리를 다루지만 데이터 전처리부터 각종 머신러닝 기법과 딥러닝 기법을 두루 다루며, 지도학습과 비지도학습의 활용 방안도 살펴봅니다. 캐글에 있는 기본 튜토리얼뿐만 아니라 텍스트 데이터 시각화나 전처리 과정, 파이프라인을 통한 병렬처리를 통한 성능 개선을 추가로 다룰 예정입니다. 함께 도전해볼까요?

강의 튜토리얼을 먼저 확인해보세요!

이 강의가 
도움이 되는 분들 🔍

복잡한 
텍스트 데이터로부터 
의미를 찾고자 
하는 분 

개발을 위해 
자연어 처리를 
배우고자 하는 
챗봇 개발자 

감정 분석에 필요한 
여러 가지 기법을 
배우고자 하는 
데이터 분석가 

머신러닝/딥러닝, 
NLP 등에 
쉽고 재미있게 
입문하고 싶은 분 


강의를 들으면
무엇을 할 수 있나요? 📌

IMDB 영화 리뷰 데이터를 통해 머신러닝의 분류 기법을 배울 수 있습니다. 머신러닝의 지도학습과 비지도 학습에 대한 활용방안을 두루 배우게 됩니다. 지도 학습으로는 머신러닝을 통한 감정 분석을 하게 되며, 비지도 학습으로 차원 축소와 클러스터링 기법을 배우게 됩니다.

  • 자연어처리(NLP: Neuro-Linguistic Programming)
  • 텍스트 데이터 전처리(정규화, 토큰화, 어근화, 형태소 분석, 어간 추출, 음소 표기법)
  • 데이터 분석
  • 텍스트 데이터 시각화 기법(Matplotlib, Seaborn)
  • 머신러닝(Scikit-learn) 및 딥러닝
  • 파이썬(Python) 표준 라이브러리를 통한 간단한 퍼셉트론 구현
  • 온라인 러닝, Vowpal Wabbit 개념
  • 다양한 텍스트 데이터 벡터화 기법(Bag of Words, n-gram, TF-IDF, Word2Vec)
  • 파이프라인 구현을 통해 성능 최적화
  • 앙상블(Random Forest)과 부스팅(Xgboost)기법

📣 수강 전 확인해주세요!

  • 4GB 이상의 메모리, 듀얼코어 이상의 CPU 환경에서 수강하는 것을 권장합니다.
  • 텍스트 데이터 전처리에 시간이 오래 걸리기에 장비의 성능이 조금 부족하다면 영상 하단의 Google Colaboratory 링크를 통해 실습해 주세요!

이 강의를 만든
지식공유자가 궁금하다면? 👩‍💻

지식공유자 박조은 X 인프런 인터뷰

이런 분들께 추천드려요!

🎓
학습 대상은
누구일까요?
복잡한 텍스트 데이터로 부터 의미를 찾고자 하는 사람
챗봇개발자, 데이터 분석가, 머신러닝, 딥러닝 입문자
📚
선수 지식,
필요할까요?
파이썬 판다스 데이터 분석
머신러닝/딥러닝 기초

안녕하세요
박조은 입니다.
박조은의 썸네일
  • Microsoft MVP(Python Developer Technologies)

  • 오늘코드 YouTube 📺 https://youtube.com/todaycode

  • “모두가 데이터에 친숙해지는 날이 오길”– 마이크로소프트웨어 (링크)

  • 네이버 커넥트 재단 부스트코스 데이터사이언스 강의 설계 및 교수자

  • 서울대 빅데이터혁신공유대학, 서울대 평생교육원, 연세대 DX Academy, 한신대 ABC Camp, 한양대 대학원, 전남대,

    한국능률협회, 삼성SDS 멀티캠퍼스, 멋쟁이사자처럼, 패스트캠퍼스, 모두의연구소 등 다수의 교육기관 및 기업 강의

  • 다양한 도메인(제약, 통신, 자동차, 커머스, 교육, 정부기관 등)의 기업 데이터 분석

  • 20년이상 게임, 광고, 교육 등 다양한 도메인에서 웹 백엔드 개발자 및 데이터 분석가 현업 경험

커리큘럼 총 17 개 ˙ 3시간 30분의 수업
이 강의는 영상, 수업 노트가 제공됩니다. 미리보기를 통해 콘텐츠를 확인해보세요.
섹션 0. IMDB 영화리뷰 데이터를 통한 자연어처리 강좌 소개
섹션 1. 캐글 영화 리뷰 분석 튜토리얼 1
[1/4] Pandas로 데이터 불러오기 미리보기 07:26 [2/4] NLP 텍스트 데이터 전처리 미리보기 24:29
[3/4] CountVectorizer로 텍스트 데이터 벡터화 08:08
[4/4] 랜덤포레스트로 영화 감성 예측 평가 ROC / AUC 17:39
섹션 2. 캐글 영화 리뷰 분석 튜토리얼 2
[1/3] 딥러닝 기법 Word2Vec 소개 미리보기 09:19
[2/3] Gensim을 통해 벡터화, t-SNE로 시각화하기 09:45
[3/3] 평균 feature vector 구하기 08:28
섹션 3. 캐글 영화 리뷰 분석 튜토리얼 3
[1/2] 비지도학습인 K-means 로 Word2Vec으로 벡터화 한 단어를 군집화(Clustering) 09:38
[2/2] K-means로 군집화(Clustering) 하고 bag of centroids를 생성하고 랜덤포레스트로 학습, 예측하기 12:01
섹션 4. 캐글 영화 리뷰 분석 튜토리얼 번외
섹션 5. 캐글 영화 리뷰 분석 : 퍼셉트론과 온라인 학습
[1/4] 퍼셉트론으로 AUC 0.95의 스코어를 얻기 10:29
[2/4] 2017 수능 6월 평가원 모의고사 국어영역 지문으로 읽는 퍼셉트론 05:50
[3/4] Vowpal Wabbit의 해싱트릭과 온라인 학습을 통해 점진적으로 오류율을 낮추는 방법 07:05
[4/4] 파이썬 표준라이브러리만으로 퍼셉트론을 구현 하고 해싱트릭으로 적은 메모리를 사용하기 20:53
강의 게시일 : 2018년 04월 09일 (마지막 업데이트일 : 2020년 03월 30일)
수강평 총 41개
수강생분들이 직접 작성하신 수강평입니다.
4.6
41개의 수강평
5점
4점
3점
2점
1점
VIEW 추천 순 최신 순 높은 평점 순 낮은 평점 순 평점 순 높은 평점 순 낮은 평점 순
주재홍 thumbnail
5
친절한 설명 좋네요
2023-10-03
피넛버터제임이 thumbnail
4
초심자가 듣기에는 조금 어렵지만 유익했습니다!
2022-06-18
crecengu thumbnail
5
선생님 강의 잘 보고 있습니다. 이번에 영화 분석 강의 수강 하려고 하는데, 강의 자료는 어디서 받을 수 있을까요~?
2022-11-05
Youngmin Kim thumbnail
5
자세한 설명과 예제와 리소스, 첨부 등으로 강의보다 훨씬 더 많은 것을 얻어가는 듯 합니다. 감사합니다.
2022-10-28
나대엽 thumbnail
5
감사합니다.
2022-06-22