강의

멘토링

커뮤니티

Data Science

/

Data Analysis

Phương pháp phân tích Big Data/Text Mining (LDA, BERTtopic, phân tích cảm xúc, CONCOR với ChatGPT)

Đây là khóa học học các kỹ thuật phân tích Text Mining, Big Data, tần suất từ, trực quan hóa Word Cloud, hình thái từ, Topic Modeling bằng Python và ChatGPT, cùng với cách ứng dụng kỹ thuật phân tích dữ liệu Text Mining, cách sử dụng cơ bản trong luận văn nghiên cứu khi viết.

(4.5) 15 đánh giá

151 học viên

  • HappyAI
빅데이터분석
Big Data
Text Mining

Đánh giá từ những học viên đầu tiên

Bạn sẽ nhận được điều này sau khi học.

  • Tóm tắt bí quyết cốt lõi Text Mining dùng Python

  • Phân tích tần suất từ

  • Trực quan hóa Word cloud

  • phân tích hình thái

  • TF-IDF giúp xác định độ quan trọng trong văn bản

  • Phân loại chủ đề văn bản sử dụng kỹ thuật LDA

  • Phương pháp diễn giải dữ liệu khi viết luận văn Big Data/Text Mining

  • Lý thuyết cốt lõi về Text Mining

  • Phân tích cảm xúc sử dụng từ điển cảm xúc KNU (Trích xuất từ vựng cảm xúc, Tỷ lệ tài liệu cảm xúc)

Để khai thác văn bản hoặc viết bài báo liên quan đến khai thác văn bản
Chào mừng những ai có thắc mắc! 🙌

Sẽ dễ hiểu hơn nếu bạn tham gia các bài giảng miễn phí "Khai thác văn bản cơ bản: Phân tích đánh giá ứng dụng bằng Python" "Bài giảng cơ bản về Textom: Phân tích nhận dạng SNS để viết bài báo dữ liệu lớn" trước khi tham gia khóa học .

Bài giảng này hướng dẫn bạn cách viết bài báo sử dụng các kỹ thuật cốt lõi trong các bài báo khai thác văn bản/phân tích dữ liệu lớn, từ các mô hình cổ điển như mô hình chủ đề LDA và phân tích tình cảm KNU đến kỹ thuật mới nhất, BERTopic.

Bài giảng này được thiết kế để giúp sinh viên sau đại học và các nhà nghiên cứu trong lĩnh vực nhân văn, nghệ thuật, giáo dục thể chất, sức khỏe và y học viết các bài báo về dữ liệu lớn.

Những sinh viên không chuyên ngành và sinh viên khoa học xã hội có thể loại bỏ nỗi sợ hãi và sự không chắc chắn về việc viết bài khai thác văn bản thông qua bài giảng này !

Bài giảng cũng bao gồm bí quyết thực hiện phân tích khai thác dữ liệu lớn/văn bản dễ dàng bằng ChatGPT .

" 📖 Người mới bắt đầu không cần phải tốn hàng giờ để phân tích các bài báo/văn bản về dữ liệu lớn. "

"Bài giảng dành cho những ai muốn học sâu nhưng ngắn gọn"

📚 Đây không phải là bài giảng giải thích các lý thuyết phức tạp hay những lời giải thích dài dòng mang tính lý thuyết.

Lý thuyết toán học được sử dụng trong mô hình LDA

🗝 Đây không phải là bài giảng cung cấp lời giải thích lý thuyết ở cấp độ chuyên gia mà là bài giảng thực tế có thể áp dụng ngay cho những người viết bài báo về công việc hoặc dữ liệu lớn.

Kết quả trực quan hóa các mô hình LDA chủ yếu được sử dụng trong các bài báo và thực hành

Chúng tôi cũng sẽ hướng dẫn bạn cách sử dụng mô hình BERTopic, mô hình này xuất hiện khá nhiều gần đây.

🗝 Bạn có thể áp dụng phân tích văn bản bằng cách chỉ cần sửa đổi mã được sử dụng trong bài giảng . (Cung cấp mã cho phép phân tích dữ liệu chỉ bằng cách thay đổi dữ liệu đầu vào )

📚 Bài giảng này là phiên bản tóm tắt của 6 năm kinh nghiệm phân tích văn bản và nghiên cứu.

📚 Chúng tôi dạy bạn những kỹ thuật cốt lõi được sử dụng nhiều nhất cho người mới bắt đầu.

Khai thác văn bản và dữ liệu lớn ngày càng được ứng dụng nhiều hơn trong mọi lĩnh vực nghiên cứu.

Thực hành doanh nghiệp cũng đòi hỏi khả năng xử lý dữ liệu văn bản phải được nhận dạng.

Chúng tôi đã tạo ra một bài giảng hiệu quả để bất kỳ ai cũng có thể dễ dàng theo dõi xu hướng hiện tại của dữ liệu lớn và khai thác văn bản thay vì mã hóa phức tạp và khó khăn.

  • 📚 Các dự án phân tích văn bản và nghiên cứu sử dụng Python

      

    💻 Bài giảng này sẽ giúp bạn viết một bài nghiên cứu dữ liệu lớn bằng cách sử dụng các kỹ thuật khai thác văn bản! (Đây là bài giảng giới thiệu dành cho người mới bắt đầu.)

    🚀 Chúng tôi sẽ dạy bạn những lý thuyết cốt lõi về phân tích văn bản và các kỹ thuật phân tích văn bản có thể áp dụng trong thực tế.

    🗝 Chúng tôi giúp bạn khám phá thông tin chi tiết từ khối lượng lớn tài liệu văn bản.

  • ✅ Khóa học này hướng dẫn các kỹ thuật phân tích dữ liệu lớn và khai thác văn bản bằng Python, đồng thời trình bày cách trích xuất thông tin có ý nghĩa từ dữ liệu và văn bản.

  • ✅ Đây là bài giảng phân tích văn bản để viết bài báo dữ liệu lớn (bài giảng cơ bản nhất để phân tích nhận dạng và phân tích xu hướng).

  • Tìm hiểu về thu thập và tinh chỉnh dữ liệu, xử lý trước dữ liệu văn bản, phân tích tần suất, phân tích TF-IDF, đám mây từ, LDA và mô hình hóa chủ đề bằng cách sử dụng phân tích tình cảm.

✅ Chúng tôi sẽ hướng dẫn bạn cách phân tích dữ liệu lớn dễ dàng hơn bằng cách sử dụng ChatGPT , LLM mới nhất.

Học những điều như thế này 📚

Bạn sẽ hiểu cách phân tích dữ liệu lớn và dữ liệu văn bản bằng Python.

Bạn sẽ học các kỹ thuật cần thiết để phân tích dữ liệu, chẳng hạn như xử lý dữ liệu trước, trực quan hóa và phân tích thống kê .

Bạn có thể học các kỹ năng phân tích dữ liệu cần thiết để viết một bài báo về dữ liệu lớn.

Bạn có thể cải thiện kỹ năng phân tích dữ liệu của mình bằng cách tìm hiểu nhiều công cụ và kỹ thuật phân tích dữ liệu và văn bản khác nhau .

Chúng tôi sẽ thực hành quy trình thu thập dữ liệu BigKinds và trích xuất trực tiếp dữ liệu để sử dụng trong các bài báo.

Chúng tôi sẽ hướng dẫn bạn cách phân tích dữ liệu lớn dễ dàng hơn bằng cách sử dụng ChatGPT, một mô hình AI đang là xu hướng hiện nay.


Tôi giới thiệu điều này cho những người này 🙆‍♀️

Các nhà nghiên cứu, nhà khoa học dữ liệu và kỹ sư máy học làm việc trong lĩnh vực dữ liệu

Các nhà nghiên cứu và sinh viên sau đại học muốn viết bài báo về khai thác văn bản và dữ liệu lớn

Bất kỳ ai quan tâm đến công nghệ phân tích dữ liệu lớn và phân tích khai thác văn bản

Tham gia bài giảng này 😊

Sinh viên lo lắng về phân tích dữ liệu và viết báo cáo có thể củng cố kỹ năng của mình thông qua khóa học này.

Bằng cách học cách trích xuất thông tin có ý nghĩa từ dữ liệu và văn bản thông qua các bài giảng, sinh viên sẽ có thể đạt được trình độ năng lực cao trong lĩnh vực phân tích dữ liệu lớn và khai thác văn bản. Những kỹ năng này sẽ đóng góp rất lớn vào năng lực công việc và thành tích học tập của sinh viên.


Tính năng bài giảng ✨

Cung cấp thông tin về trích xuất và phân tích dữ liệu cần thiết cho việc viết bài báo

Phân tích dữ liệu thực tế bằng Python thực tế

Giải thích dễ hiểu mà ngay cả người mới bắt đầu học Python cũng có thể hiểu được

Tìm hiểu cách trích xuất thông tin có ý nghĩa từ dữ liệu lớn và dữ liệu văn bản bằng Python.

Sự cân bằng hợp lý giữa lý thuyết và thực hành! Đào tạo thực hành để tiến hành phân tích dữ liệu thực tế dựa trên lý thuyết

Vui lòng viết đánh giá khóa học sau khi hoàn thành 100% khóa học. Chúng tôi sẽ cung cấp bài giảng Textom cho những người hoàn thành 100% bài giảng và viết bài đánh giá!


Khuyến nghị cho
những người này

Khóa học này dành cho ai?

  • Học viên cao học, nghiên cứu viên viết luận văn/bài báo về Text Mining/Big Data

  • Người muốn học kỹ thuật Text mining

  • Người dùng Python làm Text mining

  • Thực hiện dự án và đề tài nghiên cứu Text mining

  • Người muốn phân tích dữ liệu mạng xã hội (SNS)

  • Người muốn tìm hiểu nhu cầu của khách hàng thông qua phân tích phản hồi và đánh giá để làm marketing.

  • Ai muốn thử phân tích cảm xúc

Cần biết trước khi bắt đầu?

  • Cần biết một chút cú pháp Python cơ bản.

  • Cần biết cách sử dụng Google Colab.

Xin chào
Đây là

4,210

Học viên

194

Đánh giá

50

Trả lời

4.7

Xếp hạng

10

Các khóa học

안녕하세요 AI와 빅데이터 분석에 진심인 해피AI 이진규입니다.

[강사약력]

이진규 (Lee JinKyu)

해피AI (Happy AI CEO)

생성 AI 및 빅데이터 분석 분야의 최신 트렌드, 인사이트, 기술 활용 방법을 깊이 있게 전달합니다.

 

🎒  강연 및 외주 문의

[email] leejinkyu0612@naver.com

[Blog] 📺https://blog.naver.com/leejinkyu0612

[YouTube] 📺 https://www.youtube.com/@HappyAI_0612

[github] https://github.com/leejin-kyu/

[Homepage] https://happyaidata.kr

[H.P] 010-9973-2113

[kakao] jinkyu0612

 

📘 크몽 Prime 전문가(상위 2%)📺https://kmong.com/gig/345782

 삼성전자, 서울대, 교육청, 경기연구원, 산림청, 국립공원관리공단, 서울시 등 다수의 정부기관 및 교육기관 프로젝트 진행

의료,커머스,생태,법학,경제,예체능 등 다양한 도메인의 연구경험(총 연구 프로젝트 200회 이상 진행)

 

📘 Bio

- 2024.07~ 생성 AI 및 빅데이터 분석 전문기업 해피AI 대표

- 2023~ 퍼블릭 뉴스 AI 칼럼니스트(AI편향 및 RAG챗봇 전문)

- 2022. AI대학원 박사과정 수료(자연어처리 및 LLM 전공)

- 2021~2023 AI/빅데이터 전문 기업 스텔라비전 개발자

- 2018~2021 정부출연연구기관 자연어처리/빅데이터 분석 연구원 (인문사회과학 데이터 연구)

 

🎒Courses & Activities

 

2025

LLM/sLLM 애플리케이션 개발 강의-파인튜닝, RAG, Agent 기반 . KT(2025)

 

2024

Langchain 및 RAG 등 LLM 프로그래밍.삼성SDS(2024)

ChatGPT 기반 빅데이터 분석 입문. 렛유인에듀 (2024)

인공지능 기초 및 데이터 분석 기초 강의. 한국직업개발원 (2024)

LLM 실무자를 위한 LLM이론 및 Langchain 기반 RAG챗봇 개발 강의. 서울디지털 재단 (2024)

쉽게 따라하는 LDA & 감성분석 빅데이터분석법 with ChatGPT. 인프런 (2024)

파이썬을 활용한 텍스트 분석 강의. 서울과학기술대학교 (2024)

랭체인(LangChain)을 활용한 LLM 챗봇 만들기(feat.ChatGPT). 인프런 (2024)

 

2023

ChatGPT를 활용한 파이썬 기초 강의. 경기대학교 (2023)

빅데이터 전문가 과정 특강. 단국대학교 (2023)

빅데이터 분석 기초 강의. 렛유인에듀 (2023)

 

 

💻 Projects

LLM 기반 산림 복원 빅데이터 분석(국립산림과학원)

Private LLM 기반 RAG 챗봇 모델 구축 (한국전력공사)

AI 기반 빅데이터 분석 기법을 적용한 설문 데이터 분석 (A정부기관)

내부망 전용 PrivateLLM을 활용한 텍스트마이닝 솔루션 개발 (D 정부기관)

빅데이터 분석을 통한 한우시장 트렌드 분석 (이화브리오)

Instruction Tuning 및 강화학습(RLHF)을 통한 LLM 모델 개발 (서울디지털재단)

AI 언어모델 기반 헬스케어 서비스의 사용자 리뷰 텍스트 분석 (삼성전자)

자연어 처리 기술 기반 텍스트마이닝을 활용한 연구동향 분석 (한국대기환경학회)

AI 모델 kopatBERT 기반 특허 논문 QA 모델 개발 (한국기술마켓)

딥러닝 기반 토픽모델링을 활용한 법학 설문 빅데이터 분석 (서울대학교)

AI 모델 Word2Vec과 감성분석을 적용한 설문 문항 빅데이터 분석 (경기연구원)

AI 모델 RNN 기반 리뷰 인사이트 추출 및 분석 프로그램 개발 (서클플랫폼)

빅데이터를 활용한 2022년 국립공원 탐방 키워드 분석 (국립공원관리공단)

이외에도 다수의 공공기관, 기업체와 개인적 의뢰 등 총 200건 이상 프로젝트 진행

 

📖 Publication

 [주요 논문 ]

Improving Commonsense Bias Classification by Mitigating the Influence of Demographic Terms.2024.

Improving Generation of Sentiment Commonsense by Bias Mitigation" International Conference on Big Data and Smart Computing.2023.

언론기사 빅데이터 분석을 통한 대규모 언어모델에 대한 기술 인식 분석: ChatGPT 등장 전후를 중심으로, 2024

자연어 처리(NLP)기반 텍스트마이닝을 활용한 소나무에 대한 국내외 연구동향(2001∼2020)분석 | 농업생명과학연구 | 2022

숲길에 대한 10 년간의 언론 인식분석-텍스트 마이닝 분석을 중심으로 | 산림경제연구 | 2021

이외에도 타 분야에서 다수의 학술논문, 학술발표, 연구보고서 등의 성과 창출

Others

Python을 활용한 데이터분석 및 시각화

LLM을 활용한 데이터분석

ChatGPT와 LangChain,Agent을 활용한 업무 생산성 향상

Chương trình giảng dạy

Tất cả

48 bài giảng ∙ (5giờ 38phút)

Tài liệu khóa học:

Tài liệu bài giảng
Ngày đăng: 
Cập nhật lần cuối: 

Đánh giá

Tất cả

15 đánh giá

4.5

15 đánh giá

  • runying03057863님의 프로필 이미지
    runying03057863

    Đánh giá 1

    Đánh giá trung bình 5.0

    5

    63% đã tham gia

    Xin chào, tôi đang để lại phần đánh giá khóa học sau khi nghe được khoảng một nửa buổi học. Tôi có bằng Tiến sĩ về ngôn ngữ học và đang tham gia khóa học hoàn toàn không có kiến ​​​​thức về Python. Giáo viên viết mã tốt và giải thích rõ ràng nên tôi nghe rất hài lòng. Gần đây em liên tục gặp lỗi liên quan đến việc sử dụng LDAvis nên thầy giúp em từ xa lúc 10h tối mà đến 12h30 cũng không được. Lúc đó đã muộn và cô giáo đã rất cố gắng giúp đỡ tôi nhưng tôi thực sự rất tiếc vì cô ấy không thể giúp được nhưng cô giáo đã sửa lỗi và gửi mã cho tôi qua email vào ngày hôm sau. Thầy là một người chân thành và nhiệt huyết với bài giảng của mình. (Khi vào thì để ý thấy giáo viên cũng đã cập nhật code trong danh sách bài giảng) Ngay cả khi bạn không có kiến ​​thức liên quan đến Python như tôi, bạn vẫn có thể tham gia giảng dạy nếu có khó khăn gì. anh ấy sẽ giúp bạn, vì vậy tôi hy vọng bạn sẽ tham gia bài giảng. Sau khi kết thúc khóa học này, tôi dự định tham gia một khóa học khác (trả phí) của bạn. Tôi hết lòng giới thiệu cả nội dung khóa học và giáo viên.

    • 밝은 비버님의 프로필 이미지
      밝은 비버

      Đánh giá 1

      Đánh giá trung bình 5.0

      5

      45% đã tham gia

      Đây là bài giảng mà tôi tìm thấy như một tia sáng khi tôi đang nản lòng khi tự mình nghiên cứu khai thác văn bản :-) Bạn giải thích tất cả các phương pháp hot được đề cập trong rất nhiều bài báo hiện nay, nhưng sao lại dễ hiểu đến vậy..!! (Thành thật mà nói, nếu bạn muốn mang nó đến trường thì nó tương đương với một bài giảng trong một học kỳ... Tôi không thể tin được là bạn lại dạy nó một cách cô đọng đến vậy.>.<) Trên hết, đây là một bài giảng thực hành hơn là một bài giảng lý thuyết nên rất hữu ích về mặt thực tiễn, và nó đáng giá từng xu học phí vì đây là một bài giảng có kiến ​​thức cô đọng. Đúng hơn là nó có vẻ rẻ tiền..ㅠㅠ Còn một điều nữa...điều hoàn hảo nhất ở bài giảng này...!! Nếu bạn để lại câu hỏi, giáo viên sẽ đưa ra phản hồi gần như theo thời gian thực và giúp các bạn cùng nhau giải quyết vấn đề cho đến cuối cùng, vì vậy tôi sẽ đồng ý với bạn!!^bb Cảm ơn thầy ~~

      • yeobi852767님의 프로필 이미지
        yeobi852767

        Đánh giá 1

        Đánh giá trung bình 5.0

        5

        100% đã tham gia

        Đối với các sinh viên tốt nghiệp hoặc các nhà nghiên cứu đang chuẩn bị một bài nghiên cứu khai thác văn bản, khóa học này thực sự giống như mưa trong hạn hán. Có rất nhiều sách trên thị trường liên quan đến khai thác văn bản Python, nhưng không có sách nào cung cấp hướng dẫn cho người mới bắt đầu viết mã thực sự áp dụng mã hóa vào tài liệu nghiên cứu. Bài giảng này đề cập đến mã hóa Python từ giai đoạn thu thập dữ liệu đến các phương pháp phân tích để mã hóa có thể được áp dụng trực tiếp vào nghiên cứu. giấy tờ. Nó rất hữu ích vì nó cho thấy toàn bộ quá trình nó thực sự hoạt động như thế nào. Tôi đặc biệt thích việc họ cung cấp phản hồi nhanh chóng và tử tế cho những câu hỏi mà tôi tò mò. Bài giảng này không dạy chi tiết các nguyên tắc ngữ pháp mã hóa. Tuy nhiên, ngay cả khi bạn không biết viết mã, khóa học này cho phép bạn áp dụng ngay những phần cần thiết cho nghiên cứu vào thực hành, vì vậy đây là khóa học hoàn hảo cho những ai muốn nghiên cứu khai thác văn bản nhưng gặp khó khăn khi áp dụng mã hóa!

        • pupplejin님의 프로필 이미지
          pupplejin

          Đánh giá 1

          Đánh giá trung bình 5.0

          5

          100% đã tham gia

          • aa47474198510님의 프로필 이미지
            aa47474198510

            Đánh giá 1

            Đánh giá trung bình 5.0

            5

            100% đã tham gia

            Thật tuyệt khi anh/chị đã chỉ cách áp dụng vào luận văn! Hy vọng sau này sẽ có thêm những khóa học chuyên sâu như thế này nữa :)

            Ưu đãi có thời hạn, kết thúc sau 6 ngày ngày

            77.000 ₫

            30%

            2.297.143 ₫

            Khóa học khác của HappyAI

            Hãy khám phá các khóa học khác của giảng viên!

            Khóa học tương tự

            Khám phá các khóa học khác trong cùng lĩnh vực!