강의

멘토링

커뮤니티

AI Technology

/

AI Agent Development

Phân tích dữ liệu LLM - Từ trích xuất dữ liệu web đến hệ thống đề xuất

Khóa học này tập trung vào những lời giải thích dễ hiểu và các dự án thực hành khác nhau dành cho người mới bắt đầu. Chúng tôi thu thập dữ liệu bằng cách sử dụng công cụ thu thập dữ liệu web và LangChain, đồng thời sử dụng LLM để xử lý hệ thống tóm tắt, trích xuất, phân tích cảm tính và đề xuất.

(4.7) 21 đánh giá

165 học viên

Độ khó Cơ bản

Thời gian Không giới hạn

  • pdstudio
LLM
LLM
LangChain
LangChain
Web Crawling
Web Crawling
Web Scraping
Web Scraping
Recommendation System
Recommendation System
LLM
LLM
LangChain
LangChain
Web Crawling
Web Crawling
Web Scraping
Web Scraping
Recommendation System
Recommendation System

Đánh giá từ những học viên đầu tiên

Đánh giá từ những học viên đầu tiên

4.7

5.0

류재안

100% đã tham gia

Xin chào. Tôi đang học web scraping để phân tích xu hướng xã hội. Mặc dù giáo trình đã một năm tuổi nên có phần hơi khác so với hiện tại, nhưng về tổng thể luồng và cấu trúc thì rất hữu ích để tham khảo. Các ví dụ về LLM cũng được giải thích dễ hiểu nên tôi hiểu rất rõ. Bây giờ chỉ còn việc áp dụng thôi. Tôi đã học rất tốt. Cảm ơn bạn.

5.0

서강식

31% đã tham gia

Tôi tin tưởng bạn

5.0

네버엔딩스터디

100% đã tham gia

Dòng chảy của sông là tự nhiên Người hướng dẫn giải thích một cách dễ dàng và ngắn gọn. Nó được hoàn thành nhanh chóng và không có bất kỳ sự gián đoạn nào! Xin hãy cho tôi một bài giảng hay vào lần tới.

Bạn sẽ nhận được điều này sau khi học.

  • Sử dụng web crawling/scraping để thu thập dữ liệu

  • Sử dụng công cụ LangChain và LLM để thu thập, tinh chế và phân tích dữ liệu

  • Phân tích dự đoán sử dụng LLM (phân tích cảm xúc, tóm tắt, đề xuất sản phẩm, v.v.)

Nâng cấp lên LangChain và LLM
Thu thập dữ liệu và phân tích dữ liệu trên web
🚀

Khóa học này được thiết kế để giúp người mới bắt đầu dễ dàng tìm hiểu thu thập dữ liệu trên web, thu thập dữ liệu bằng công cụ LangChain và kỹ thuật phân tích dữ liệu bằng LLM. Tìm hiểu cách thu thập dữ liệu cần thiết từ web và phân tích dữ liệu đó để rút ra những hiểu biết sâu sắc về doanh nghiệp.

Bài giảng bao gồm các kỹ thuật thu thập và phân tích dữ liệu bằng LangChain và LLM, bao gồm cả đào tạo thu thập dữ liệu/cạo web bằng BeautifulSoup và Selenium. Chúng tôi trực tiếp thu thập dữ liệu tin tức theo thời gian thực, dữ liệu nhận xét và đánh giá sản phẩm YouTube cũng như dữ liệu quỹ ETF, đồng thời trực tiếp triển khai các hệ thống tóm tắt, trích xuất, phân tích cảm tính và đề xuất bằng LLM.

Thu thập trong khi di chuyển phân trang với Selenium

Trích xuất và tổng hợp thông tin sản phẩm từ các video review sản phẩm YouTube

Khái niệm cơ bản về thu thập dữ liệu web bằng Python + Ứng dụng LangChain (LLM)

Đặc điểm của bài giảng

1⃣ Học tập theo dự án, định hướng thực hành

Tìm hiểu cách thực hiện thu thập dữ liệu web của các trang web thực. Chọn và thu thập các danh mục tin tức theo thời gian thực từ cổng thông tin và thực hiện tóm tắt văn bản, trích xuất từ ​​khóa và trích xuất thông tin thực thể. Chúng tôi cũng phân tích các video đánh giá sản phẩm trên YouTube và tạo hệ thống đề xuất quỹ ETF của Hoa Kỳ.

Phân tích video đánh giá sản phẩm YouTube

2⃣ Áp dụng kỹ thuật LLM mới nhất bằng LangChain

Trước tiên, chúng tôi tìm hiểu các kỹ thuật thu thập dữ liệu web truyền thống, sau đó đề cập đến các kỹ thuật thu thập dữ liệu bằng công cụ LangChain và kỹ thuật phân tích dữ liệu bằng LLM. Mức độ khó được điều chỉnh từng bước để người mới bắt đầu có thể dễ dàng theo dõi. (Bài giảng Python và bài giảng LangChain dành cho người mới bắt đầu được cung cấp miễn phí.)

LangChain cung cấp các bài giảng miễn phí

3⃣ Cung cấp thông tin cập nhật khi có thay đổi trên trang web

Trong trường hợp ví dụ về thu thập dữ liệu web, nếu cấu hình trang web hoặc mã nguồn thay đổi, trang web có thể không chạy như cũ. Chúng tôi định kỳ kiểm tra các video bài giảng và mã thực hành để cung cấp thông tin cập nhật.

Màn hình thành phần danh mục đầu tư quỹ ETF

Những lưu ý trước khi tham gia khóa học

Môi trường phòng thí nghiệm

  • Hệ điều hành và phiên bản (OS): Bài giảng dựa trên Windows (Người dùng Linux và MacOS cũng có thể thực hành)

  • Các công cụ được sử dụng: Yêu cầu khóa xác thực Miniconda, Jupyter Lab, OpenAI API (có thể áp dụng chi phí riêng)

  • Yêu cầu về PC: PC hoặc laptop có truy cập Internet

tài liệu học tập

  • Cung cấp tài liệu cần thiết cho việc thực hành (văn bản, mã nguồn)

  • Sách giáo khoa tham khảo LangChain được cung cấp trên Wikidocs: https://wikidocs.net/book/14473

Kiến thức và biện pháp phòng ngừa của người chơi

  • Bất kỳ ai có kiến ​​thức Python cơ bản (bài giảng Python miễn phí được cung cấp: link )

  • Hiểu biết cơ bản về LLM và LangChain (có khóa học liên quan miễn phí: link )

  • Nếu bạn có bất kỳ câu hỏi hoặc ý kiến, xin vui lòng hỏi.

Link thông tin bài giảng (1)

  • RAG Master: Từ cơ bản đến kỹ thuật nâng cao (feat. LangChain)

  • Từ việc triển khai RAG đến đánh giá hiệu suất -

    Quá trình phát triển AI thực tế hoàn thành sau 9 giờ

    • Thực hành xây dựng hệ thống RAG dựa trên LangChain

    • Tìm hiểu các kỹ thuật RAG nâng cao

    • Phương pháp đánh giá hiệu suất hệ thống RAG

    • Cú pháp LCEL mới nhất của LangChain và cách sử dụng Runnable


  • Liên kết: https://inf.run/mdYe4

Link thông tin bài giảng (2)

  • Tạo chatbot & RAG Python thông qua các dự án - sử dụng LangChain và Gradio

  • Gồm tổng cộng 4 dự án


    • Chatbot QA đơn giản: Cài đặt môi trường phát triển, cấu trúc LLM Chain, hiểu giao diện Gradio

    • Chatbot RAG dựa trên PDF: hiểu kỹ thuật RAG, hiểu thông số mô hình, triển khai giao diện chatbot

    • Chatbot phân tích dữ liệu: Tải lên tệp CSV và phân tích dữ liệu (Single Agent)

    • Chatbot phân tích đầu tư: Nghiên cứu và phân tích đầu tư liên quan đến tiền điện tử (Đa tác nhân)

  • Liên kết: https://inf.run/PfJaS

Link thông tin bài giảng (3)

  • Hệ thống RAG được triển khai với tác nhân AI (w. LangGraph)

  • Tác nhân AI thông minh Thế hệ tìm kiếm tăng cường (RAG) được triển khai với LangGraph


    • Thiết kế và triển khai cấu trúc tác nhân AI bằng LangGraph

    • Áp dụng các tác nhân AI vào Thế hệ tăng cường truy xuất (RAG)

    • Mở rộng khả năng của các tác nhân AI bằng cách triển khai chức năng Gọi công cụ

    • Nắm vững các kiến ​​trúc RAG tác nhân mới nhất, bao gồm RAG thích ứng, RAG tự phục vụ và RAG khắc phục.

  • Liên kết: https://inf.run/hTwjC

Khuyến nghị cho
những người này

Khóa học này dành cho ai?

  • 웹 trang muốn thu thập dữ liệu cần thiết

  • LLM là phương pháp phân tích dữ liệu mà bạn muốn học

  • Những người muốn học cách học và áp dụng Python

  • Những người thích các bài giảng theo dự án, định hướng thực hành

Cần biết trước khi bắt đầu?

  • Kiến thức cơ bản về Python

  • Kiến thức cơ bản về các khái niệm LLM (không bắt buộc, khuyến khích)

Xin chào
Đây là

15,820

Học viên

719

Đánh giá

161

Trả lời

4.8

Xếp hạng

7

Các khóa học

Xin chào. Tôi đang làm việc trong lĩnh vực phân tích dữ liệu và phát triển dịch vụ trí tuệ nhân tạo sử dụng Python. Tôi vẫn luôn không ngừng viết sách và giảng dạy về trí tuệ nhân tạo để chia sẻ những nội dung mình đã nghiên cứu và tìm hiểu về các chủ đề quan tâm đến với mọi người.

[Lịch sử làm việc]

Hiện là CEO của một startup Fintech

Cựu) CDO tại Dacon

Cựu Giáo sư kiêm nhiệm Khoa Phần mềm máy tính, Đại học Induk

Kaggle Competition Expert, Kỹ sư phân tích dữ liệu lớn (Big Data Analysis Certification)

[Giảng dạy]

Giảng viên đăng ký NCS (Trí tuệ nhân tạo)

Được chọn là 'Đối tác xuất sắc' trong chương trình đào tạo SW tại Cơ sở SeSAC của Cơ quan Chấn hưng Kinh tế Seoul (SBA) (Phát triển mô hình AI sử dụng Python)

Giảng dạy tại Viện Bảo mật Tài chính, Hiệp hội Thúc đẩy Công nghiệp Điện tử và Thông tin Hàn Quốc, Hiệp hội Công nghiệp Hiển thị Hàn Quốc, Viện Thúc đẩy Công nghiệp Kỹ thuật số Daegu, v.v.

Kinh nghiệm giảng dạy tại các doanh nghiệp trong nước và các trường đại học lớn tại Hàn Quốc như Đại học Quốc gia Seoul, Đại học Quốc gia Pusan, Đại học Kyung Hee, Đại học Ngoại ngữ Hàn Quốc, v.v.

Giảng dạy tại Hiệp hội Thúc đẩy Công nghiệp, Hiệp hội Công nghiệp Hiển thị Hàn Quốc, Viện Thúc đẩy Công nghiệp Kỹ thuật số Daegu, v.v. Có kinh nghiệm đào tạo tại các doanh nghiệp trong nước và các trường đại học lớn tại Hàn Quốc như Đại học Quốc gia Seoul, Đại học Pusan, Đại học Kyung Hee, Đại học Ngoại ngữ Hàn Quốc, v.v.

[Tác giả]

[YouTube] Pandas Studio: https://youtube.com/@pandas-data-studio?si=XoLVQzJ9mmdFJQHU

Chương trình giảng dạy

Tất cả

29 bài giảng ∙ (3giờ 10phút)

Tài liệu khóa học:

Tài liệu bài giảng
Ngày đăng: 
Cập nhật lần cuối: 

Đánh giá

Tất cả

21 đánh giá

4.7

21 đánh giá

  • junghwanoh8198님의 프로필 이미지
    junghwanoh8198

    Đánh giá 3

    Đánh giá trung bình 5.0

    5

    31% đã tham gia

    • dskim1097님의 프로필 이미지
      dskim1097

      Đánh giá 33

      Đánh giá trung bình 4.9

      5

      100% đã tham gia

      • seldikorea님의 프로필 이미지
        seldikorea

        Đánh giá 4

        Đánh giá trung bình 5.0

        5

        31% đã tham gia

        • swlee1288님의 프로필 이미지
          swlee1288

          Đánh giá 1

          Đánh giá trung bình 5.0

          5

          100% đã tham gia

          • it11841527님의 프로필 이미지
            it11841527

            Đánh giá 3

            Đánh giá trung bình 5.0

            5

            31% đã tham gia

            1.381.331 ₫

            Khóa học khác của pdstudio

            Hãy khám phá các khóa học khác của giảng viên!

            Khóa học tương tự

            Khám phá các khóa học khác trong cùng lĩnh vực!