77,000원
월 15,400원
5개월 할부 시
초급자를 위해 준비한
[자연어 처리] 강의입니다.
파이썬 한국어 텍스트 분석과 자연어처리 워드클라우드 시각화, 형태소 분석, 토픽모델링, 군집화, 유사도 분석, 텍스트데이터 벡터화를 위한 단어 가방과 TF-IDF, 머신러닝과 딥러닝을 활용한 텍스트 분류, 허깅페이스 활용법
✍️
이런 걸
배워요!
이런 걸
배워요!
워드클라우드 시각화
형태소 분석
토픽모델링
군집화
유사도 분석
텍스트데이터 벡터화를 위한 단어 가방과 TF-IDF
머신러닝과 딥러닝(RNN, LSTM)을 활용한 텍스트 분류
허깅페이스를 활용한 BERT와 koGPT2 활용하기
이런 분들께 추천드려요!
🎓
학습 대상은
누구일까요?
학습 대상은
누구일까요?
텍스트 분석이 필요한 비즈니스 전문가
연구와 논문에 토픽모델링이나 유사도 분석이 필요한 연구자
텍스트 분석 프로젝트를 하려는 학생
텍스트 분석 포트폴리오를 만들고자 하는 취업 준비생
📚
선수 지식,
필요할까요?
선수 지식,
필요할까요?
파이썬 기본 문법
주피터 혹은 Google Colab 사용법
안녕하세요
박조은 입니다.
박조은 입니다.
Microsoft MVP(Python Developer Technologies)
네이버 커넥트 재단 부스트코스 데이터사이언스 강의 설계 및 교수자
서울대 빅데이터혁신공유대학, 서울대 평생교육원, 연세대 DX Academy, 한신대 ABC Camp, 한양대 대학원, 전남대,
한국능률협회, 삼성SDS 멀티캠퍼스, 멋쟁이사자처럼, 패스트캠퍼스, 모두의연구소 등 다수의 교육기관 및 기업 강의
다양한 도메인(제약, 통신, 자동차, 커머스, 교육, 정부기관 등)의 기업 데이터 분석
20년이상 게임, 광고, 교육 등 다양한 도메인에서 웹 백엔드 개발자 및 데이터 분석가 현업 경험
커리큘럼
총 52 개
˙ 17시간 33분의 수업
이 강의는 영상, 수업 노트가 제공됩니다. 미리보기를 통해 콘텐츠를 확인해보세요.
섹션 0. 텍스트 분석 개요
2 강
∙ 11분
📝 무엇을 배울 수 있나요? - 오리엔테이션
미리보기
11:27
💻 수업 자료 다운로드 안내 📚
섹션 1. 텍스트 분석을 위한 파이썬과 판다스 문자열 기초
4 강
∙ 1시간 21분
섹션 2. 텍스트 분석과 워드클라우드 시각화 기초
2 강
∙ 44분
0103 KLUE 데이터를 통한 문자열 전처리와 워드클라우드
24:55
0103 정규표현식, PeCab 형태소 분석기, 워드클라우드 마스크 처리
19:22
섹션 3. 형태소 분석 기초
2 강
∙ 28분
0104 KoNLPy Okt 형태소 분석기를 활용한 전처리
15:58
0104 KoNLPy Okt 형태소 분석기를 활용한 어간 추출(Stemming)
12:31
섹션 4. 텍스트 벡터화
4 강
∙ 1시간 7분
0201 단어 가방(BOW, Bag of Words)
14:49
0201 사이킷런을 활용한 단어 벡터화의 이해, fit, fit_transform 의 차이
14:35
0201 n-gram, min_df, max_df, max_features, stopwords 의 차이
16:37
0201 TF-IDF를 통한 가중치 적용
21:47
섹션 5. 토픽모델링
3 강
∙ 1시간 4분
📖 (이론) 토픽모델링 개요
17:07
0202 KLUE 잠재 디리클레 할당 (Latent Dirichlet Allocation, LDA) 토픽모델링
24:02
0202 KLUE 비음수 행렬 분해(Non-Negative Matrix Factorization, NMF) 토픽모델링
23:01
섹션 6. 텍스트 군집분석
4 강
∙ 1시간 9분
0203 텍스트 데이터 군집화 - 초간단 음식리뷰 텍스트로 Pecab 전처리하고 클러스터링
17:57
0203 텍스트 데이터 군집화 - 초간단 음식리뷰 클러스터링 결과 차원축소하고 시각화 하기
11:24
0204 쇼핑 리뷰 군집화 - KMeans, Elbow, Silhouette 분석
22:59
0204 쇼핑 리뷰 군집화 결과 분석 - 실제 제품과 군집 교차표 분석
17:27
섹션 7. 표절 찾기와 추천시스템에 활용되는 텍스트 유사도 분석
2 강
∙ 38분
0205 서울120 텍스트로 코사인유사도를 이용한 유사한 문서 찾기
20:20
0205 서울120 텍스트로 유클리드 거리, 상관계수, 자카드를 이용한 유사도 활용
17:43
섹션 8. 머신러닝을 활용한 텍스트 분류
10 강
∙ 3시간 30분
0300 초간단 코퍼스로 분류 기초 이해하기
24:41
0301 KLUE Dacon 데이터셋 소개, 텍스트 길이 분석
28:59
0301 KLUE 정규표현식, 불용어 전처리
11:48
0301 KLUE Pecab 형태소 분석, 워드클라우드 시각화
16:20
0302 KLUE 분류 - 단어 가방(BOW) 텍스트 벡터화
20:33
0302 KLUE 분류 - 의사결정나무(DecisionTree)
23:47
0303 KLUE 분류(Bagging) 01 - TF-IDF 벡터화
16:17
0303 KLUE 분류(Bagging) 02 - RandomForest 교차 검증
24:24
0304 KLUE 하이퍼파라미터 튜닝 01 - PeCab 특정 품사 제거 후 TF-IDF 벡터화
16:47
0304 KLUE 하이퍼파라미터 튜닝 02 - 그리드서치와 랜덤서치로 최적의 하이퍼파라미터 찾기
27:14
섹션 9. 텐서플로 딥러닝을 활용한 분류 분석
10 강
∙ 3시간 50분
📖 (이론) 단어 벡터화와 임베딩 이해
14:09
0401 초간단 음식리뷰 01 - 텐서플로를 활용한 텍스트 벡터화와 임베딩
26:30
0401 초간단 음식리뷰 02 - 텐서보드 사용하기와 임베딩 프로젝터로 시각화 하기
35:15
📖 (이론) 자연어처리를 위한 딥러닝 기초 핵심
43:29
0402 KLUE 딥러닝 01 - 시퀀스를 고려하는 텍스트 벡터화
22:20
0402 KLUE 딥러닝 02 - 텍스트 임베딩과 학습(fit) 텐서보드 응용
20:06
0402 KLUE 딥러닝 03 - 예측하고 DACON 제출하기, 임베딩 프로젝터 응용하기
11:18
📖 (이론) 텐서플로를 활용한 RNN, LSTM 문서 분류 기초
18:37
0403 RNN KLUE 01 텍스트 임베딩
17:20
0403 RNN KLUE 02- LSTM 을 활용한 텍스트 분류
21:45
섹션 10. 허깅페이스와 트랜스포머로 주요 태스크 활용하기
9 강
∙ 3시간 26분
(이론) 허깅페이스와 트랜스포머
23:26
0500 허깅페이스 튜토리얼 따라하기
42:42
0501 BERT 분류 KLUE/bert-base subword tokenizer 로 토큰화 하기
26:27
0501 BERT 분류 KLUE/bert-base 사전학습 모델로 학습하고 예측하기
20:46
0502 KoGPT2 토크나이저 사용하기
19:58
0502 koGPT2 모델로 문장 생성하기
12:04
0503 AI Hub 요약문 및 레포트 생성 데이터 전처리 하기
19:17
0504 AI Hub 요약문 및 레포트 생성 데이터 KoGPT2 학습 데이터셋 만들기
20:21
0504 AI Hub 요약문 및 레포트 생성 데이터 KoGPT2 추가 학습과 ROUGE 스코어 구하기
21:02
강의 게시일 : 2023년 12월 18일
(마지막 업데이트일 : 2023년 12월 26일)
수강평
총 6개
수강생분들이 직접 작성하신 수강평입니다.
5
6개의 수강평
5점
4점
3점
2점
1점
VIEW
추천 순
최신 순
높은 평점 순
낮은 평점 순
평점 순
높은 평점 순
낮은 평점 순
연관 로드맵
이 강의가 포함된 잘 짜여진 로드맵을 따라 학습해 보세요!