강의

멘토링

로드맵

Inflearn brand logo image
Data Science

/

Data Analysis

Phương pháp phân tích Big Data/Text Mining (LDA, BERTtopic, phân tích cảm xúc, CONCOR với ChatGPT)

Đây là khóa học học các kỹ thuật phân tích Text Mining, Big Data, tần suất từ, trực quan hóa Word Cloud, hình thái từ, Topic Modeling bằng Python và ChatGPT, cùng với cách ứng dụng kỹ thuật phân tích dữ liệu Text Mining, cách sử dụng cơ bản trong luận văn nghiên cứu khi viết.

(4.4) 13 đánh giá

140 học viên

  • HappyAI
빅데이터분석
Big Data
Text Mining

Đánh giá từ những học viên đầu tiên

Dịch cái này sang tiếng Việt

  • Tóm tắt bí quyết cốt lõi Text Mining dùng Python

  • Phân tích tần suất từ

  • Trực quan hóa Word cloud

  • phân tích hình thái

  • TF-IDF giúp xác định độ quan trọng trong văn bản

  • Phân loại chủ đề văn bản sử dụng kỹ thuật LDA

  • Phương pháp diễn giải dữ liệu khi viết luận văn Big Data/Text Mining

  • Lý thuyết cốt lõi về Text Mining

  • Phân tích cảm xúc sử dụng từ điển cảm xúc KNU (Trích xuất từ vựng cảm xúc, Tỷ lệ tài liệu cảm xúc)

Để khai thác văn bản hoặc viết bài báo liên quan đến khai thác văn bản
Chào mừng những ai có thắc mắc! 🙌

Sẽ dễ hiểu hơn nếu bạn tham gia các bài giảng miễn phí "Khai thác văn bản cơ bản: Phân tích đánh giá ứng dụng bằng Python" "Bài giảng cơ bản về Textom: Phân tích nhận dạng SNS để viết bài báo dữ liệu lớn" trước khi tham gia khóa học .

Bài giảng này hướng dẫn bạn cách viết bài báo sử dụng các kỹ thuật cốt lõi trong các bài báo khai thác văn bản/phân tích dữ liệu lớn, từ các mô hình cổ điển như mô hình chủ đề LDA và phân tích tình cảm KNU đến kỹ thuật mới nhất, BERTopic.

Bài giảng này được thiết kế để giúp sinh viên sau đại học và các nhà nghiên cứu trong lĩnh vực nhân văn, nghệ thuật, giáo dục thể chất, sức khỏe và y học viết các bài báo về dữ liệu lớn.

Những sinh viên không chuyên ngành và sinh viên khoa học xã hội có thể loại bỏ nỗi sợ hãi và sự không chắc chắn về việc viết bài khai thác văn bản thông qua bài giảng này !

Bài giảng cũng bao gồm bí quyết thực hiện phân tích khai thác dữ liệu lớn/văn bản dễ dàng bằng ChatGPT .

" 📖 Người mới bắt đầu không cần phải tốn hàng giờ để phân tích các bài báo/văn bản về dữ liệu lớn. "

"Bài giảng dành cho những ai muốn học sâu nhưng ngắn gọn"

📚 Đây không phải là bài giảng giải thích các lý thuyết phức tạp hay những lời giải thích dài dòng mang tính lý thuyết.

Lý thuyết toán học được sử dụng trong mô hình LDA

🗝 Đây không phải là bài giảng cung cấp lời giải thích lý thuyết ở cấp độ chuyên gia mà là bài giảng thực tế có thể áp dụng ngay cho những người viết bài báo về công việc hoặc dữ liệu lớn.

Kết quả trực quan hóa các mô hình LDA chủ yếu được sử dụng trong các bài báo và thực hành

Chúng tôi cũng sẽ hướng dẫn bạn cách sử dụng mô hình BERTopic, mô hình này xuất hiện khá nhiều gần đây.

🗝 Bạn có thể áp dụng phân tích văn bản bằng cách chỉ cần sửa đổi mã được sử dụng trong bài giảng . (Cung cấp mã cho phép phân tích dữ liệu chỉ bằng cách thay đổi dữ liệu đầu vào )

📚 Bài giảng này là phiên bản tóm tắt của 6 năm kinh nghiệm phân tích văn bản và nghiên cứu.

📚 Chúng tôi dạy bạn những kỹ thuật cốt lõi được sử dụng nhiều nhất cho người mới bắt đầu.

Khai thác văn bản và dữ liệu lớn ngày càng được ứng dụng nhiều hơn trong mọi lĩnh vực nghiên cứu.

Thực hành doanh nghiệp cũng đòi hỏi khả năng xử lý dữ liệu văn bản phải được nhận dạng.

Chúng tôi đã tạo ra một bài giảng hiệu quả để bất kỳ ai cũng có thể dễ dàng theo dõi xu hướng hiện tại của dữ liệu lớn và khai thác văn bản thay vì mã hóa phức tạp và khó khăn.

  • 📚 Các dự án phân tích văn bản và nghiên cứu sử dụng Python

      

    💻 Bài giảng này sẽ giúp bạn viết một bài nghiên cứu dữ liệu lớn bằng cách sử dụng các kỹ thuật khai thác văn bản! (Đây là bài giảng giới thiệu dành cho người mới bắt đầu.)

    🚀 Chúng tôi sẽ dạy bạn những lý thuyết cốt lõi về phân tích văn bản và các kỹ thuật phân tích văn bản có thể áp dụng trong thực tế.

    🗝 Chúng tôi giúp bạn khám phá thông tin chi tiết từ khối lượng lớn tài liệu văn bản.

  • ✅ Khóa học này hướng dẫn các kỹ thuật phân tích dữ liệu lớn và khai thác văn bản bằng Python, đồng thời trình bày cách trích xuất thông tin có ý nghĩa từ dữ liệu và văn bản.

  • ✅ Đây là bài giảng phân tích văn bản để viết bài báo dữ liệu lớn (bài giảng cơ bản nhất để phân tích nhận dạng và phân tích xu hướng).

  • Tìm hiểu về thu thập và tinh chỉnh dữ liệu, xử lý trước dữ liệu văn bản, phân tích tần suất, phân tích TF-IDF, đám mây từ, LDA và mô hình hóa chủ đề bằng cách sử dụng phân tích tình cảm.

✅ Chúng tôi sẽ hướng dẫn bạn cách phân tích dữ liệu lớn dễ dàng hơn bằng cách sử dụng ChatGPT , LLM mới nhất.

Học những điều như thế này 📚

Bạn sẽ hiểu cách phân tích dữ liệu lớn và dữ liệu văn bản bằng Python.

Bạn sẽ học các kỹ thuật cần thiết để phân tích dữ liệu, chẳng hạn như xử lý dữ liệu trước, trực quan hóa và phân tích thống kê .

Bạn có thể học các kỹ năng phân tích dữ liệu cần thiết để viết một bài báo về dữ liệu lớn.

Bạn có thể cải thiện kỹ năng phân tích dữ liệu của mình bằng cách tìm hiểu nhiều công cụ và kỹ thuật phân tích dữ liệu và văn bản khác nhau .

Chúng tôi sẽ thực hành quy trình thu thập dữ liệu BigKinds và trích xuất trực tiếp dữ liệu để sử dụng trong các bài báo.

Chúng tôi sẽ hướng dẫn bạn cách phân tích dữ liệu lớn dễ dàng hơn bằng cách sử dụng ChatGPT, một mô hình AI đang là xu hướng hiện nay.


Tôi giới thiệu điều này cho những người này 🙆‍♀️

Các nhà nghiên cứu, nhà khoa học dữ liệu và kỹ sư máy học làm việc trong lĩnh vực dữ liệu

Các nhà nghiên cứu và sinh viên sau đại học muốn viết bài báo về khai thác văn bản và dữ liệu lớn

Bất kỳ ai quan tâm đến công nghệ phân tích dữ liệu lớn và phân tích khai thác văn bản

Tham gia bài giảng này 😊

Sinh viên lo lắng về phân tích dữ liệu và viết báo cáo có thể củng cố kỹ năng của mình thông qua khóa học này.

Bằng cách học cách trích xuất thông tin có ý nghĩa từ dữ liệu và văn bản thông qua các bài giảng, sinh viên sẽ có thể đạt được trình độ năng lực cao trong lĩnh vực phân tích dữ liệu lớn và khai thác văn bản. Những kỹ năng này sẽ đóng góp rất lớn vào năng lực công việc và thành tích học tập của sinh viên.


Tính năng bài giảng ✨

Cung cấp thông tin về trích xuất và phân tích dữ liệu cần thiết cho việc viết bài báo

Phân tích dữ liệu thực tế bằng Python thực tế

Giải thích dễ hiểu mà ngay cả người mới bắt đầu học Python cũng có thể hiểu được

Tìm hiểu cách trích xuất thông tin có ý nghĩa từ dữ liệu lớn và dữ liệu văn bản bằng Python.

Sự cân bằng hợp lý giữa lý thuyết và thực hành! Đào tạo thực hành để tiến hành phân tích dữ liệu thực tế dựa trên lý thuyết

Vui lòng viết đánh giá khóa học sau khi hoàn thành 100% khóa học. Chúng tôi sẽ cung cấp bài giảng Textom cho những người hoàn thành 100% bài giảng và viết bài đánh giá!


Khuyến nghị cho
những người này

Khóa học này dành cho ai?

  • Học viên cao học, nghiên cứu viên viết luận văn/bài báo về Text Mining/Big Data

  • Người muốn học kỹ thuật Text mining

  • Người dùng Python làm Text mining

  • Thực hiện dự án và đề tài nghiên cứu Text mining

  • Người muốn phân tích dữ liệu mạng xã hội (SNS)

  • Người muốn tìm hiểu nhu cầu của khách hàng thông qua phân tích phản hồi và đánh giá để làm marketing.

  • Ai muốn thử phân tích cảm xúc

Cần biết trước khi bắt đầu?

  • Cần biết một chút cú pháp Python cơ bản.

  • Cần biết cách sử dụng Google Colab.

Xin chào
Đây là

3,671

Học viên

132

Đánh giá

49

Trả lời

4.6

Xếp hạng

9

Các khóa học

안녕하세요 AI와 빅데이터 분석에 진심인 해피AI 이진규입니다.

[강사약력]

이진규 (Lee JinKyu)

해피AI (Happy AI CEO)

생성 AI 및 빅데이터 분석 분야의 최신 트렌드, 인사이트, 기술 활용 방법을 깊이 있게 전달합니다.

 

🎒  강연 및 외주 문의

[email] leejinkyu0612@naver.com

[Blog] 📺https://blog.naver.com/leejinkyu0612

[YouTube] 📺 https://www.youtube.com/@HappyAI_0612

[github] https://github.com/leejin-kyu/

[Homepage] https://happyaidata.kr

[H.P] 010-9973-2113

[kakao] jinkyu0612

 

📘 크몽 Prime 전문가(상위 2%)📺https://kmong.com/gig/345782

 삼성전자, 서울대, 교육청, 경기연구원, 산림청, 국립공원관리공단, 서울시 등 다수의 정부기관 및 교육기관 프로젝트 진행

의료,커머스,생태,법학,경제,예체능 등 다양한 도메인의 연구경험(총 연구 프로젝트 200회 이상 진행)

 

📘 Bio

- 2024.07~ 생성 AI 및 빅데이터 분석 전문기업 해피AI 대표

- 2023~ 퍼블릭 뉴스 AI 칼럼니스트(AI편향 및 RAG챗봇 전문)

- 2022. AI대학원 박사과정 수료(자연어처리 및 LLM 전공)

- 2021~2023 AI/빅데이터 전문 기업 스텔라비전 개발자

- 2018~2021 정부출연연구기관 자연어처리/빅데이터 분석 연구원 (인문사회과학 데이터 연구)

 

🎒Courses & Activities

 

2025

LLM/sLLM 애플리케이션 개발 강의-파인튜닝, RAG, Agent 기반 . KT(2025)

 

2024

Langchain 및 RAG 등 LLM 프로그래밍.삼성SDS(2024)

ChatGPT 기반 빅데이터 분석 입문. 렛유인에듀 (2024)

인공지능 기초 및 데이터 분석 기초 강의. 한국직업개발원 (2024)

LLM 실무자를 위한 LLM이론 및 Langchain 기반 RAG챗봇 개발 강의. 서울디지털 재단 (2024)

쉽게 따라하는 LDA & 감성분석 빅데이터분석법 with ChatGPT. 인프런 (2024)

파이썬을 활용한 텍스트 분석 강의. 서울과학기술대학교 (2024)

랭체인(LangChain)을 활용한 LLM 챗봇 만들기(feat.ChatGPT). 인프런 (2024)

 

2023

ChatGPT를 활용한 파이썬 기초 강의. 경기대학교 (2023)

빅데이터 전문가 과정 특강. 단국대학교 (2023)

빅데이터 분석 기초 강의. 렛유인에듀 (2023)

 

 

💻 Projects

LLM 기반 산림 복원 빅데이터 분석(국립산림과학원)

Private LLM 기반 RAG 챗봇 모델 구축 (한국전력공사)

AI 기반 빅데이터 분석 기법을 적용한 설문 데이터 분석 (A정부기관)

내부망 전용 PrivateLLM을 활용한 텍스트마이닝 솔루션 개발 (D 정부기관)

빅데이터 분석을 통한 한우시장 트렌드 분석 (이화브리오)

Instruction Tuning 및 강화학습(RLHF)을 통한 LLM 모델 개발 (서울디지털재단)

AI 언어모델 기반 헬스케어 서비스의 사용자 리뷰 텍스트 분석 (삼성전자)

자연어 처리 기술 기반 텍스트마이닝을 활용한 연구동향 분석 (한국대기환경학회)

AI 모델 kopatBERT 기반 특허 논문 QA 모델 개발 (한국기술마켓)

딥러닝 기반 토픽모델링을 활용한 법학 설문 빅데이터 분석 (서울대학교)

AI 모델 Word2Vec과 감성분석을 적용한 설문 문항 빅데이터 분석 (경기연구원)

AI 모델 RNN 기반 리뷰 인사이트 추출 및 분석 프로그램 개발 (서클플랫폼)

빅데이터를 활용한 2022년 국립공원 탐방 키워드 분석 (국립공원관리공단)

이외에도 다수의 공공기관, 기업체와 개인적 의뢰 등 총 200건 이상 프로젝트 진행

 

📖 Publication

 [주요 논문 ]

Improving Commonsense Bias Classification by Mitigating the Influence of Demographic Terms.2024.

Improving Generation of Sentiment Commonsense by Bias Mitigation" International Conference on Big Data and Smart Computing.2023.

언론기사 빅데이터 분석을 통한 대규모 언어모델에 대한 기술 인식 분석: ChatGPT 등장 전후를 중심으로, 2024

자연어 처리(NLP)기반 텍스트마이닝을 활용한 소나무에 대한 국내외 연구동향(2001∼2020)분석 | 농업생명과학연구 | 2022

숲길에 대한 10 년간의 언론 인식분석-텍스트 마이닝 분석을 중심으로 | 산림경제연구 | 2021

이외에도 타 분야에서 다수의 학술논문, 학술발표, 연구보고서 등의 성과 창출

Others

Python을 활용한 데이터분석 및 시각화

LLM을 활용한 데이터분석

ChatGPT와 LangChain,Agent을 활용한 업무 생산성 향상

Chương trình giảng dạy

Tất cả

48 bài giảng ∙ (5giờ 38phút)

Tài liệu khóa học:

Tài liệu bài giảng
Ngày đăng: 
Cập nhật lần cuối: 

Đánh giá

Tất cả

13 đánh giá

4.4

13 đánh giá

  • 뚱이 언니님의 프로필 이미지
    뚱이 언니

    Đánh giá 1

    Đánh giá trung bình 5.0

    5

    63% đã tham gia

    안녕하세요, 수업 반절 정도 들은 시점에서 강의 평가 남깁니다. 저는 어학 박사 취득하고 파이썬에 관해서는 아예 지식이 전무한 상태로 강의듣고 있는데요, 선생님이 코드를 잘 짜주시고, 설명도 잘해주셔서 만족하면서 듣고 있습니다. 얼마전 LDAvis 이용 관련해서 계속 오류가 나서 선생님이 저녁 10시에 원격으로 도와주셨는데, 12시 30반까지 해도 도저히 안되는거에요. 늦은 시간이기도 하고, 선생님도 정말 도와주시려고 노력하시는데 안되서 정말 죄송했는데, 선생님이 그 다음날 메일로 오류 수정하셔서 코드 전달해 주시더라고요. 그만큼 강의에 진심이고, 열정적이신 분이에요. (들어와 보니 선생님이 강의 목록에 코드 업데이트도 해주셨더라고요) 저처럼 파이썬 관련 지식 전무해도 강의 들으실 수 있고요, 선생님께 어려움 요청하면 잘 도와주시니 강의 꼭 들으셨으면 좋겠습니다. 저는 이 강좌 끝나면 선생님 다른 (유료)강의 들으려고요. 강의 내용도 선생님도 진심으로 추천합니다.

    • 밝은 비버님의 프로필 이미지
      밝은 비버

      Đánh giá 1

      Đánh giá trung bình 5.0

      5

      45% đã tham gia

      텍스트마이닝 독학으로 공부하다 좌절하고 있을 때 한줄기 빛과 같이 찾아낸 강의입니다:-) 요즘 논문에서 많이 다루고 있는 핫한 방법론 다 설명해주시는데 왜 이렇게 이해가 잘되나요..!! (솔직히 학교에서 들으려면 1학기 강의 분량인데..이렇게 컴팩트하게 알려주시다니>.<) 무엇보다 이론 강의가 아닌 실습 강의라 실무적으로 엄청 도움이 되었고 완전완전 지식이 농축된 강의라 수강료가 하나도 아깝지 않았습니다. 오히려 저렴하다고 느껴질정도..ㅠㅠ 한 가지 더 이 강의에서 가장...완벽한 점은..!! 질문 남기면 선생님께서 피드백도 거의 실시간이시고 끝까지 같이 해결해주시려고 도움 주시는 부분에서 감히 엄지 척을 살포시 드리고 갑니다!!^^bb 감사합니다 선생님~~

      • 우아한 북극곰님의 프로필 이미지
        우아한 북극곰

        Đánh giá 1

        Đánh giá trung bình 5.0

        5

        100% đã tham gia

        텍스트 마이닝 연구 논문을 준비하고 있는 대학원생 또는 연구자에게는 정말 가뭄에 단비와 같은 강의입니다. 시중에 파이썬 텍스트 마이닝과 관련된 책은 여럿 있으나 코딩 초보자가 실제로 코딩을 연구 논문에 적용하는데 방향을 잡아주는 것이 없는데 이 강의는 연구논문에서 바로 적용할 수 있도록 자료수집 단계부터 분석방법에 대한 파이썬 코딩이 실제로 어떻게 이루어지는지에 대한 과정을 다 보여주셔서 너무 많은 도움이 됩니다. 특히 궁금한 부분에 대한 피드백도 신속하고 친절하게 해 주신점도 좋았습니다. 이 강의는 코딩 문법의 원리를 자세히 알려주는 강의는 아닙니다. 하지만 코딩을 모르더라도 연구에 필요한 부분을 실전에 바로 적용할 수 있는 강의인 만큼 텍스트 마이닝 연구를 하고 싶으나 코딩 적용은 어려운 분들께 너무나 적합한 강의입니다!

        • geogeo2020님의 프로필 이미지
          geogeo2020

          Đánh giá 2

          Đánh giá trung bình 5.0

          5

          100% đã tham gia

          • (suhee)기댐. 믿음은 통로.님의 프로필 이미지
            (suhee)기댐. 믿음은 통로.

            Đánh giá 2

            Đánh giá trung bình 5.0

            5

            31% đã tham gia

            2.301.592 ₫

            Khóa học khác của HappyAI

            Hãy khám phá các khóa học khác của giảng viên!

            Khóa học tương tự

            Khám phá các khóa học khác trong cùng lĩnh vực!