Thumbnail
BEST 데이터 사이언스 데이터 분석
[NLP] IMDB 영화리뷰 감정 분석을 통한 파이썬 텍스트 분석과 자연어 처리
(4.6)
27개의 수강평 ∙ 2390명의 수강생

22,000원

지식공유자 : 박조은
총 17개 수업˙총 3시간 30분
평생 무제한 수강
수료증 발급 강의
입문 초급 중급이상 대상
이 강의는 멘토링 신청이 가능합니다.
멘토링은 수강 신청과 별개로 운영되며, 수강생이 아니어도 신청할 수 있습니다.
내 목록 추가 488 공유
중급자를 위해 준비한
[데이터 분석, 프로그래밍 언어] 강의입니다.

캐글에 있는 IMDB 영화리뷰 감정 분석 경진대회를 통해 자연어 처리에 필요한 기초 이론과 실습을 해보는 강의입니다.

IMDB 영화리뷰 감정 분석을 통한 파이썬 자연어 처리 강좌

이 강좌는 캐글에 있는 IMDB 영화리뷰 감정 분석 경진대회를 통해 자연어 처리에 필요한 기초 이론과 실습을 해보는 강의입니다. 자연어처리는 챗봇이나 텍스트분석 뿐만 아니라 머신러닝/딥러닝 모델 개발시 데이터 전처리 과정에서 널리 사용됩니다. 

자연어처리를 다루지만 데이터 전처리부터 각종 머신러닝 기법과 딥러닝 기법을 두루다루며, 지도학습과 비지도학습의 활용 방안도 다룹니다. 캐글에 있는 기본 튜토리얼에 텍스트데이터 시각화나 전처리 과정, 파이프라인을 통한 병렬처리로 성능개선을 추가로 다루고 있습니다.

💻 할 수 있게 되는 것들

  • 텍스트 데이터를 전처리하고 데이터 분석 및 분류
  • 복잡한 컨텍스트를 정제하고 분석
  • 다양한 측면으로 텍스트 데이터를 바라보는 시각
  • 머신러닝의 지도학습과 비지도 학습을 배우고 활용에 대한 감각
  •  파이썬 표준 라이브러리를 통해 초기의 퍼셉트론을 밑바닥부터 구현

📚 배우는 것들

IMDB 영화 리뷰 데이터를 통해 머신러닝의 분류 기법을 배울 수 있습니다. 머신러닝의 지도학습과 비지도 학습에 대한 활용방안을 두루 배우게 됩니다. 지도 학습으로는 머신러닝을 통한 감정 분석을 하게 되며, 비지도 학습으로 차원 축소와 클러스터링 기법을 배우게 됩니다.

자연어처리, 텍스트 데이터 전처리(정규화, 토큰화, 어근화, 형태소 분석, 어간 추출, 음소 표기법), 데이터 분석, 텍스트 데이터 시각화 기법(Matplotlib, Seaborn), 머신러닝(Scikit-learn), 딥러닝, 데이터 분석, 파이썬 표준 라이브러리를 통한 간단한 퍼셉트론 구현, 온라인 러닝, Vowpal Wabbit 개념, 다양한 텍스트 데이터 벡터화 기법(Bag of Words, n-gram, TF-IDF, Word2Vec), 파이프라인 구현을 통해 성능 최적화, 앙상블(Random Forest)과 부스팅(Xgboost)기법

 도움이 되는 분들

  • 복잡한 텍스트 데이터로 부터 의미를 찾고자 하는 사람
  • 챗봇개발자, 데이터 분석가, 머신러닝, 딥러닝 입문자

⚠️ 수강전 유의사항

4기가 이상의 메모리와 듀얼코어 이상의 CPU를 사용하고 있는 것을 권장합니다. 텍스트 데이터 전처리에 시간이 오래 걸리기 때문에 장비의 성능이 조금 부족하다 생각이 된다면 영상 하단의 google colaboratory 링크를 통해 실습해 주세요!


관련 로드맵

뼈문과를 위한 파이썬(Python) 현실 데이터 분석 
실제 업무에 활용 가능한 데이터 사이언스 로드맵!
  이 강의 포함 

커리큘럼 총 17 개 ˙ 3시간 30분의 수업
이 강의는 영상, 수업 노트가 제공됩니다. 미리보기를 통해 콘텐츠를 확인해보세요.
섹션 0. IMDB 영화리뷰 데이터를 통한 자연어처리 강좌 소개
섹션 1. 캐글 영화 리뷰 분석 튜토리얼 1
[1/4] Pandas로 데이터 불러오기 미리보기 07:26 [2/4] NLP 텍스트 데이터 전처리 미리보기 24:29
[3/4] CountVectorizer로 텍스트 데이터 벡터화 08:08
[4/4] 랜덤포레스트로 영화 감성 예측 평가 ROC / AUC 17:39
섹션 2. 캐글 영화 리뷰 분석 튜토리얼 2
[1/3] 딥러닝 기법 Word2Vec 소개 미리보기 09:19
[2/3] Gensim을 통해 벡터화, t-SNE로 시각화하기 09:45
[3/3] 평균 feature vector 구하기 08:28
섹션 3. 캐글 영화 리뷰 분석 튜토리얼 3
[1/2] 비지도학습인 K-means 로 Word2Vec으로 벡터화 한 단어를 군집화(Clustering) 09:38
[2/2] K-means로 군집화(Clustering) 하고 bag of centroids를 생성하고 랜덤포레스트로 학습, 예측하기 12:01
섹션 4. 캐글 영화 리뷰 분석 튜토리얼 번외
섹션 5. 캐글 영화 리뷰 분석 : 퍼셉트론과 온라인 학습
[1/4] 퍼셉트론으로 AUC 0.95의 스코어를 얻기 10:29
[2/4] 2017 수능 6월 평가원 모의고사 국어영역 지문으로 읽는 퍼셉트론 05:50
[3/4] Vowpal Wabbit의 해싱트릭과 온라인 학습을 통해 점진적으로 오류율을 낮추는 방법 07:05
[4/4] 파이썬 표준라이브러리만으로 퍼셉트론을 구현 하고 해싱트릭으로 적은 메모리를 사용하기 20:53
강의 게시일 : 2018년 04월 09일 (마지막 업데이트일 : 2020년 03월 30일)
수강평 총 27개
수강생분들이 직접 작성하신 수강평입니다. 수강평을 작성 시 300잎이 적립됩니다.
4.6
27개의 수강평
5점
4점
3점
2점
1점
VIEW 좋아요 순 최신 순 높은 평점 순 낮은 평점 순 평점 순 높은 평점 순 낮은 평점 순
khykhan thumbnail
한마디로 "그래도 물고기 잡는 법을 배울 수 있다"는게 맞을 듯 합니다. 중간에 내용 설명이 조금 빠진게 아쉽습니다. 이건 질문을 드리면 되겠네요. 감사합니다.
2021-01-01
Jinsan An thumbnail
좋은 강의 감사합니다!
2021-03-07
shpark thumbnail
실습과 예제 데이터를 보면서 강의를 볼 수 있어 좋았습니다.
2021-03-31
힘들다 thumbnail
좋은 강의입니다
2021-04-11
psj4377 thumbnail
항상 좋은 설명 감사합니다. 선생님 강의 전부다 보고 데이터 분석에 대한 능력이 올라갔습니다.
2020-12-31

22,000원

내 목록 추가 488 공유
지식공유자 : 박조은
총 17개 수업˙총 3시간 30분
평생 무제한 수강
수료증 발급 강의
입문 초급 중급이상 대상
이 강의는 멘토링 신청이 가능합니다.
멘토링은 수강 신청과 별개로 운영되며, 수강생이 아니어도 신청할 수 있습니다.
연관 로드맵
이 강의가 포함된 잘 짜여진 로드맵을 따라 학습해 보세요!
지식공유자 되기
많은 사람들에게 배움의 기회를 주고,
경제적 보상을 받아보세요.
지식공유참여
기업 교육을 위한 인프런
“인프런 비즈니스” 를 통해 모든 팀원이 인프런의 강의를
자유롭게 학습하는 환경을 제공하세요.
인프런 비즈니스