캐글에 있는 IMDB 영화리뷰 감정 분석 경진대회를 통해 자연어 처리에 필요한 기초 이론과 실습을 해보는 강의입니다.

IMDB 영화리뷰 감정 분석을 통한 파이썬 자연어 처리 강좌

이 강좌는 캐글에 있는 IMDB 영화리뷰 감정 분석 경진대회를 통해 자연어 처리에 필요한 기초 이론과 실습을 해보는 강의입니다.

자연어처리는 챗봇이나 텍스트분석 뿐만 아니라 머신러닝/딥러닝 모델 개발시 데이터 전처리 과정에서 널리 사용됩니다. 자연어처리만을 따로 다루는 온라인 강의가 많지 않은 상황이라 앞으로도 자연어처리 쪽 컨텐츠를 계속 보강하며 개발할 계획입니다.

자연어처리를 다루지만 데이터 전처리부터 각종 머신러닝 기법과 딥러닝 기법을 두루다루며, 지도학습과 비지도학습의 활용 방안도 다룹니다. 캐글에 있는 기본 튜토리얼에 텍스트데이터 시각화나 전처리 과정, 파이프라인을 통한 병렬처리로 성능개선을 추가로 다루고 있습니다.

최근 NSML로 네이버영화리뷰 자연어처리 해커톤이 올라오기도 해서 자연어처리에 관심있는 분들에게 무료로 콘텐츠를 제공하고 싶어서 강의를 열게 되었습니다.

할 수 있게 되는 것들

  • 텍스트 데이터를 전처리하고 데이터 분석 및 분류
  • 복잡한 컨텍스트를 정제하고 분석
  • 다양한 측면으로 텍스트 데이터를 바라보는 시각
  • 머신러닝의 지도학습과 비지도 학습을 배우고 활용에 대한 감각
  •  파이썬 표준 라이브러리를 통해 초기의 퍼셉트론을 밑바닥부터 구현

배우는 것들

IMDB 영화 리뷰 데이터를 통해 머신러닝의 분류 기법을 배울 수 있습니다.
머신러닝의 지도학습과 비지도 학습에 대한 활용방안을 두루 배우게 됩니다.
지도 학습으로는 머신러닝을 통한 감정 분석을 하게 되며, 비지도 학습으로 차원 축소와 클러스터링 기법을 배우게 됩니다.

자연어처리, 텍스트 데이터 전처리(정규화, 토큰화, 어근화, 형태소 분석, 어간 추출, 음소 표기법), 데이터 분석, 텍스트 데이터 시각화 기법(Matplotlib, Seaborn), 머신러닝(Scikit-learn), 딥러닝, 데이터 분석, 파이썬 표준 라이브러리를 통한 간단한 퍼셉트론 구현, 온라인 러닝, Vowpal Wabbit 개념, 다양한 텍스트 데이터 벡터화 기법(Bag of Words, n-gram, TF-IDF, Word2Vec), 파이프라인 구현을 통해 성능 최적화, 앙상블(Random Forest)과 부스팅(Xgboost)기법

 도움이 되는 분들

  • 복잡한 텍스트 데이터로 부터 의미를 찾고자 하는 사람

  • 챗봇개발자, 데이터 분석가, 머신러닝, 딥러닝 입문자

지식공유자 소개

박조은

주로 게임과 광고 분야에서 웹과 백엔드를 개발해 왔으며, 최근 데이터사이언스에 관심을 두고 캐글 스코어를 올리는 재미와 좌절 사이에 있습니다.

강좌 평가

5

5 개의 수강평
  • 5 점5
  • 4 점0
  • 3 점0
  • 2 점0
  • 1 점0
  1. 김진솔의 프로필 사진

    잘들었습니다. 혹시 강의가 올라온 것이 전체 인가요?

    5

    잘들었습니다. 혹시 강의가 올라온 것이 전체 인가요?

  2. 문성욱 Mun의 프로필 사진

    5

    따로 공부할 시간이 많지않아 조금씩 들어야 겠내요~

  3. 김대식의 프로필 사진

    항상 잘듣고있습니다 ^^

    5

    자연어 처리 기본기를 잡는데 굉장히 유용했습니다.

강좌 교육과정

캐글 영화 리뷰 분석 튜토리얼 1
MAC OSX에서 NLTK data 설치하기학습을 원하시면 최상단 '배우기 버튼을 클릭해주세요' 00:13:00
Pandas로 데이터 불러오기학습을 원하시면 최상단 '배우기 버튼을 클릭해주세요' 미리보기 00:07:00
NLP 텍스트 데이터 전처리학습을 원하시면 최상단 '배우기 버튼을 클릭해주세요' 00:24:00
CountVectorizer로 텍스트 데이터 벡터화학습을 원하시면 최상단 '배우기 버튼을 클릭해주세요' 00:08:00
랜덤포레스트로 영화 감성 예측 평가 ROC / AUC학습을 원하시면 최상단 '배우기 버튼을 클릭해주세요' 00:17:00
캐글 영화 리뷰 분석 튜토리얼 2
딥러닝 기법 Word2Vec 소개학습을 원하시면 최상단 '배우기 버튼을 클릭해주세요' 00:09:00
Gensim을 통해 벡터화 & t-SNE로 시각화학습을 원하시면 최상단 '배우기 버튼을 클릭해주세요' 00:09:00
평균 feature vector 구하기학습을 원하시면 최상단 '배우기 버튼을 클릭해주세요' 00:08:00
캐글 영화 리뷰 분석 튜토리얼 3
비지도 학습 알고리즘: K-means 군집화학습을 원하시면 최상단 '배우기 버튼을 클릭해주세요' 00:09:00
Bag of World World2Vec K-means학습을 원하시면 최상단 '배우기 버튼을 클릭해주세요' 00:12:00
캐글 영화 리뷰 분석 튜토리얼 번외
TF-IDF로 단어 벡터화, k-fold로 교차검증하기학습을 원하시면 최상단 '배우기 버튼을 클릭해주세요' 00:14:00
XGBoost 및 우승자 인터뷰 소개, 부스팅 알고리즘으로 점수 올리기학습을 원하시면 최상단 '배우기 버튼을 클릭해주세요' 00:19:00
캐글 영화 리뷰 분석 : 퍼셉트론과 온라인 학습
퍼셉트론으로 AUC 0.95의 스코어를 얻기학습을 원하시면 최상단 '배우기 버튼을 클릭해주세요' 00:10:00
2017 수능 6월 평가원 모의고사 국어영역 지문으로 읽는 퍼셉트론학습을 원하시면 최상단 '배우기 버튼을 클릭해주세요' 00:05:00
Vowpal Wabbit의 해싱트릭과 온라인 학습학습을 원하시면 최상단 '배우기 버튼을 클릭해주세요' 00:07:00
파이썬 표준라이브러리만으로 코드 구현하기학습을 원하시면 최상단 '배우기 버튼을 클릭해주세요' 00:21:00

우리는 성장기회의 평등 을 추구합니다.

경제적, 시간적 제약없는 양질을 교육으로 누구나에게 성장 기회를 균등하게 주는것. 그것이 우리의 목표입니다.

지식공유참여 고객센터
top
(주)인프랩 | 대표자:이형주 | TEL:070-4202-1180 | E-MAIL: course@inflearn.com | 사업자번호:499-81-00612
주소:성남시 분당구 삼평동 대왕판교로 645번길 12 경기창조경제혁신센터 8층 R19 | 개인정보보호책임자:이형주
통신판매업:2017-서울강남-01544 | ©INFLAB. ALL RIGHTS RESERVED