인공지능 자연어 처리

모두의 한국어 텍스트 분석과 자연어처리 with 파이썬 대시보드

(5) 6개의 수강평 ∙ 317명의 수강생

박조은

NLP 텍스트마이닝 머신러닝 data-clustering 빅데이터

77,000원

월 15,400원

5개월 할부 시

지식공유자: 박조은

총 52개 수업 (17시간 33분)

수강기한:

수료증: 발급

난이도: --

지식공유자 답변이 제공되는 강의입니다

폴더에 추가 86

초급자를 위해 준비한
[자연어 처리] 강의입니다.

파이썬 한국어 텍스트 분석과 자연어처리 워드클라우드 시각화, 형태소 분석, 토픽모델링, 군집화, 유사도 분석, 텍스트데이터 벡터화를 위한 단어 가방과 TF-IDF, 머신러닝과 딥러닝을 활용한 텍스트 분류, 허깅페이스 활용법

✍️
이런 걸
배워요!

워드클라우드 시각화

형태소 분석

토픽모델링

군집화

유사도 분석

텍스트데이터 벡터화를 위한 단어 가방과 TF-IDF

머신러닝과 딥러닝(RNN, LSTM)을 활용한 텍스트 분류

허깅페이스를 활용한 BERT와 koGPT2 활용하기

🎓
학습 대상은
누구일까요?

텍스트 분석이 필요한 비즈니스 전문가

연구와 논문에 토픽모델링이나 유사도 분석이 필요한 연구자

텍스트 분석 프로젝트를 하려는 학생

텍스트 분석 포트폴리오를 만들고자 하는 취업 준비생

📚
선수 지식,
필요할까요?

파이썬 기본 문법

주피터 혹은 Google Colab 사용법

Microsoft MVP(Python Developer Technologies)
오늘코드 YouTube 📺 https://youtube.com/todaycode
“모두가 데이터에 친숙해지는 날이 오길”– 마이크로소프트웨어 (링크)
네이버 커넥트 재단 부스트코스 데이터사이언스 강의 설계 및 교수자
서울대 빅데이터혁신공유대학, 서울대 평생교육원, 연세대 DX Academy, 한신대 ABC Camp, 한양대 대학원, 전남대,
한국능률협회, 삼성SDS 멀티캠퍼스, 멋쟁이사자처럼, 패스트캠퍼스, 모두의연구소 등 다수의 교육기관 및 기업 강의
다양한 도메인(제약, 통신, 자동차, 커머스, 교육, 정부기관 등)의 기업 데이터 분석
20년이상 게임, 광고, 교육 등 다양한 도메인에서 웹 백엔드 개발자 및 데이터 분석가 현업 경험

이 강의는 영상, 수업 노트가 제공됩니다. 미리보기를 통해 콘텐츠를 확인해보세요.

섹션 0. 텍스트 분석 개요 2 강 ∙ 11분

📝 무엇을 배울 수 있나요? - 오리엔테이션 미리보기 11:27

💻 수업 자료 다운로드 안내 📚

섹션 1. 텍스트 분석을 위한 파이썬과 판다스 문자열 기초 4 강 ∙ 1시간 21분

0101 파이썬 문자열 기초 - 전처리를 위한 인덱싱과 슬라이싱 미리보기 15:36 0101 파이썬 문자열 기초 - 전처리를 위한 문자열 나누고 합치기 미리보기 16:43 0102 판다스 문자열 접근자 기초 - 데이터프레임과 시리즈를 활용한 문자열 전처리 미리보기 16:25 0102 판다스 문자열 전처리 - 정규표현식, Pandas String data Type 미리보기 32:47

섹션 2. 텍스트 분석과 워드클라우드 시각화 기초 2 강 ∙ 44분

0103 KLUE 데이터를 통한 문자열 전처리와 워드클라우드 24:55

0103 정규표현식, PeCab 형태소 분석기, 워드클라우드 마스크 처리 19:22

섹션 3. 형태소 분석 기초 2 강 ∙ 28분

0104 KoNLPy Okt 형태소 분석기를 활용한 전처리 15:58

0104 KoNLPy Okt 형태소 분석기를 활용한 어간 추출(Stemming) 12:31

섹션 4. 텍스트 벡터화 4 강 ∙ 1시간 7분

0201 단어 가방(BOW, Bag of Words) 14:49

0201 사이킷런을 활용한 단어 벡터화의 이해, fit, fit_transform 의 차이 14:35

0201 n-gram, min_df, max_df, max_features, stopwords 의 차이 16:37

0201 TF-IDF를 통한 가중치 적용 21:47

섹션 5. 토픽모델링 3 강 ∙ 1시간 4분

📖 (이론) 토픽모델링 개요 17:07

0202 KLUE 잠재 디리클레 할당 (Latent Dirichlet Allocation, LDA) 토픽모델링 24:02

0202 KLUE 비음수 행렬 분해(Non-Negative Matrix Factorization, NMF) 토픽모델링 23:01

섹션 6. 텍스트 군집분석 4 강 ∙ 1시간 9분

0203 텍스트 데이터 군집화 - 초간단 음식리뷰 텍스트로 Pecab 전처리하고 클러스터링 17:57

0203 텍스트 데이터 군집화 - 초간단 음식리뷰 클러스터링 결과 차원축소하고 시각화 하기 11:24

0204 쇼핑 리뷰 군집화 - KMeans, Elbow, Silhouette 분석 22:59

0204 쇼핑 리뷰 군집화 결과 분석 - 실제 제품과 군집 교차표 분석 17:27

섹션 7. 표절 찾기와 추천시스템에 활용되는 텍스트 유사도 분석 2 강 ∙ 38분

0205 서울120 텍스트로 코사인유사도를 이용한 유사한 문서 찾기 20:20

0205 서울120 텍스트로 유클리드 거리, 상관계수, 자카드를 이용한 유사도 활용 17:43

섹션 8. 머신러닝을 활용한 텍스트 분류 10 강 ∙ 3시간 30분

0300 초간단 코퍼스로 분류 기초 이해하기 24:41

0301 KLUE Dacon 데이터셋 소개, 텍스트 길이 분석 28:59

0301 KLUE 정규표현식, 불용어 전처리 11:48

0301 KLUE Pecab 형태소 분석, 워드클라우드 시각화 16:20

0302 KLUE 분류 - 단어 가방(BOW) 텍스트 벡터화 20:33

0302 KLUE 분류 - 의사결정나무(DecisionTree) 23:47

0303 KLUE 분류(Bagging) 01 - TF-IDF 벡터화 16:17

0303 KLUE 분류(Bagging) 02 - RandomForest 교차 검증 24:24

0304 KLUE 하이퍼파라미터 튜닝 01 - PeCab 특정 품사 제거 후 TF-IDF 벡터화 16:47

0304 KLUE 하이퍼파라미터 튜닝 02 - 그리드서치와 랜덤서치로 최적의 하이퍼파라미터 찾기 27:14

섹션 9. 텐서플로 딥러닝을 활용한 분류 분석 10 강 ∙ 3시간 50분

📖 (이론) 단어 벡터화와 임베딩 이해 14:09

0401 초간단 음식리뷰 01 - 텐서플로를 활용한 텍스트 벡터화와 임베딩 26:30

0401 초간단 음식리뷰 02 - 텐서보드 사용하기와 임베딩 프로젝터로 시각화 하기 35:15

📖 (이론) 자연어처리를 위한 딥러닝 기초 핵심 43:29

0402 KLUE 딥러닝 01 - 시퀀스를 고려하는 텍스트 벡터화 22:20

0402 KLUE 딥러닝 02 - 텍스트 임베딩과 학습(fit) 텐서보드 응용 20:06

0402 KLUE 딥러닝 03 - 예측하고 DACON 제출하기, 임베딩 프로젝터 응용하기 11:18

📖 (이론) 텐서플로를 활용한 RNN, LSTM 문서 분류 기초 18:37

0403 RNN KLUE 01 텍스트 임베딩 17:20

0403 RNN KLUE 02- LSTM 을 활용한 텍스트 분류 21:45

섹션 10. 허깅페이스와 트랜스포머로 주요 태스크 활용하기 9 강 ∙ 3시간 26분

(이론) 허깅페이스와 트랜스포머 23:26

0500 허깅페이스 튜토리얼 따라하기 42:42

0501 BERT 분류 KLUE/bert-base subword tokenizer 로 토큰화 하기 26:27

0501 BERT 분류 KLUE/bert-base 사전학습 모델로 학습하고 예측하기 20:46

0502 KoGPT2 토크나이저 사용하기 19:58

0502 koGPT2 모델로 문장 생성하기 12:04

0503 AI Hub 요약문 및 레포트 생성 데이터 전처리 하기 19:17

0504 AI Hub 요약문 및 레포트 생성 데이터 KoGPT2 학습 데이터셋 만들기 20:21

0504 AI Hub 요약문 및 레포트 생성 데이터 KoGPT2 추가 학습과 ROUGE 스코어 구하기 21:02

강의 게시일 : 2023년 12월 18일 (마지막 업데이트일 : 2023년 12월 26일)

수강생분들이 직접 작성하신 수강평입니다.

6개의 수강평

5점

4점

3점

2점

1점

VIEW 추천 순 최신 순 높은 평점 순 낮은 평점 순 평점 순 높은 평점 순 낮은 평점 순

내용전달이 잘 됩니다.

2024-01-24

체계적으로 설명을 잘 해주셔서 이해가 빠르게 되었습니다. 정말 감사드리고... 더 좋은 강의도 많이 개설해주세요.~

2024-01-12

이해가 잘 됩니다.

2024-01-30

내용 유익하고 좋아요

2024-03-01

네이버 부스트코스에서 박조은강사님 강좌 수강이후에 - 파이토치, 텐서플로우 기본 학습하고 이어서 진행했습니다. 비전공자가 듣기 쉽고 좋으며 90%이상 프로젝트실습 위주여서 추천드립니다... 어렵게 학습했던 딥러닝에 대해서 개념을 쉽게 다시 이해하기에도 좋았습니다. 유튜브에서 진행 하시는 마케팅분석도 강의로 제공해주시면 좋을거같습니다

2024-02-23

뼈문과를 위한 현실 데이터 분석 - 파이썬

By 박조은

What's In My Bag (feat.analyst)

By 피비

모두의 한국어 텍스트 분석과 자연어처리 with 파이썬 대시보드

초급자를 위해 준비한 [자연어 처리] 강의입니다.

이런 분들께 추천드려요!

뼈문과를 위한 현실 데이터 분석 - 파이썬

What's In My Bag (feat.analyst)

초급자를 위해 준비한
[자연어 처리] 강의입니다.