강의

멘토링

커뮤니티

Data Science

/

Data Analysis

Đồ án thực hành khai thác văn bản - Phân tích dữ liệu tin tức

Bạn đã học các bài giảng về kiến ​​thức lập trình cơ bản, thu thập thông tin và khai thác văn bản, nhưng bạn có cảm thấy bối rối khi thực sự thực hiện một dự án không? Đây là khóa học mà bạn sẽ làm việc với tôi trong một dự án từ đầu đến cuối.

(3.2) 5 đánh giá

152 học viên

Độ khó Trung cấp trở lên

Thời gian Không giới hạn

  • coco
R
R
Big Data
Big Data
Web Crawling
Web Crawling
R
R
Big Data
Big Data
Web Crawling
Web Crawling

Bạn sẽ nhận được điều này sau khi học.

  • phân tích dữ liệu tin tức

  • Trực quan hóa từ khóa hàng đầu

  • word2vec

  • Hệ thống đề xuất và tìm kiếm

🙆🏻‍♀ Đây là một dự án khai thác văn bản thực tế. Khóa học này bao gồm mọi thứ, từ thu thập dữ liệu tin tức đến trích xuất và trực quan hóa các từ khóa hàng đầu hàng tháng, và thậm chí là tạo ra một hệ thống đề xuất tin tức! 🙆🏻‍♂

🗒 Giới thiệu khóa học

Bạn đã học những kiến thức cơ bản về lập trình, thu thập dữ liệu, và thậm chí đã tham gia một khóa học khai thác văn bản, nhưng bạn vẫn cảm thấy choáng ngợp khi thực sự bắt tay vào thực hiện một dự án? Khóa học này sẽ hướng dẫn bạn từng bước thực hiện một dự án từ đầu đến cuối. Khóa học sẽ bao gồm những nội dung sau:

🌈 Thu thập dữ liệu tin tức 

Nate News thu thập 400 bài viết mỗi ngày trên mọi danh mục vào năm 2019.

🌈 Tiền xử lý dữ liệu tin tức và trích xuất từ khóa hàng đầu 

Nate News thu thập 400 bài viết mỗi ngày trên mọi danh mục vào năm 2019.

🌈 Hiển thị các từ khóa hàng đầu bằng Excel

Hãy cùng hình dung các từ khóa hàng đầu theo ngày/tháng trong Excel.

🌈 Hình dung các từ khóa hàng đầu bằng biểu đồ

Nate News thu thập 400 bài viết mỗi ngày trên mọi danh mục vào năm 2019.

🌈 Word2vec

Một phương pháp biểu diễn từ cơ bản và được sử dụng rộng rãi là 'word2vec'. Hãy cùng tìm hiểu về khái niệm này và huấn luyện nó với dữ liệu tin tức.

🌈 Tạo mô hình tìm kiếm và đề xuất

Chúng tôi tạo ra mô hình đề xuất tìm kiếm tin tức bằng cách tạo một vec câu từ tiêu đề tin tức và sử dụng độ tương đồng cosin.

🙋🏻‍♂️ Tôi tò mò quá!

H. Tôi có thể nghe mà không cần biết R không?
A. Bạn nên có hiểu biết cơ bản về ngôn ngữ R, thu thập dữ liệu web và khai thác văn bản để dễ dàng theo học khóa học này. 😭😭. Tôi khuyên bạn nên tham gia khóa học nhập môn lập trình R miễn phí và khóa học khai thác văn bản.

Khuyến nghị cho
những người này

Khóa học này dành cho ai?

  • Bất kỳ ai muốn thử dự án khai thác văn bản

  • Bất cứ ai muốn phân tích dữ liệu tin tức

Cần biết trước khi bắt đầu?

  • Lập trình

  • thu thập dữ liệu web

  • Kiến thức cơ bản khai thác văn bản

Xin chào
Đây là

8,390

Học viên

509

Đánh giá

136

Trả lời

4.4

Xếp hạng

20

Các khóa học

Tôi là một người thất nghiệp vẫn đang tiếp tục học tập, sau khi tốt nghiệp cử nhân chuyên ngành Thống kê và nhận bằng Tiến sĩ Kỹ thuật Công nghiệp (Trí tuệ nhân tạo).

Giải thưởng

ㆍ Cuộc thi Big Contest lần thứ 6: Phát triển thuật toán dự đoán người dùng rời bỏ trò chơi / Giải thưởng NCSOFT (2018)

ㆍ Cuộc thi Big Contest lần thứ 5 - Phát triển thuật toán dự đoán người nợ quá hạn khoản vay / Giải thưởng của Chủ tịch Hiệp hội Xúc tiến Công nghệ Thông tin và Truyền thông Hàn Quốc (2017)

ㆍ Cuộc thi Big Data Thời tiết 2016 / Giải thưởng của Viện trưởng Viện Thúc đẩy Công nghiệp Khí tượng (2016)

ㆍ Phát triển thuật toán dự đoán gian lận bảo hiểm tại Big Contest lần thứ 4 / Lọt vào vòng chung kết (2016)

ㆍ Cuộc thi Big Contest lần thứ 3: Phát triển thuật toán dự đoán trận đấu bóng chày / Giải thưởng của Bộ trưởng Bộ Khoa học, Công nghệ thông tin và Hoạch định tương lai (2015)

* blog : https://bluediary8.tistory.com

Lĩnh vực nghiên cứu chính của tôi là khoa học dữ liệu, học tăng cường và học sâu.

Hiện tại tôi đang thực hiện việc thu thập dữ liệu (crawling) và khai phá văn bản (text mining) như một sở thích :)

Tôi đã phát triển một ứng dụng có tên là Marong, sử dụng kỹ thuật crawling để thu thập và hiển thị những bài viết phổ biến từ các cộng đồng trực tuyến, và

Tôi cũng từng thu thập danh sách các quán ăn ngon và blog trên toàn quốc để tạo ra một ứng dụng gợi ý quán ăn :) (nhưng rồi cũng thất bại thảm hại..)

Hiện tại, tôi đang là nghiên cứu sinh tiến sĩ chuyên nghiên cứu về trí tuệ nhân tạo.

Tôi đã từng phát triển và tạo ra một ứng dụng gợi ý quán ăn ngon bằng cách thu thập danh sách các nhà hàng và blog ẩm thực trên toàn quốc :) (nhưng đã thất bại thảm hại..). Hiện tại, tôi đang là nghiên cứu sinh tiến sĩ chuyên ngành trí tuệ nhân tạo.

Tôi đã từng phát triển và tạo ra một ứng dụng gợi ý quán ăn ngon bằng cách thu thập danh sách các quán ăn và blog trên toàn quốc :) (nhưng đã thất bại thảm hại..). Hiện tại, tôi đang là nghiên cứu sinh tiến sĩ chuyên ngành trí tuệ nhân tạo.

Tôi đã từng phát triển và tạo ra một ứng dụng gợi ý quán ăn ngon bằng cách thu thập danh sách các quán ăn cũng như các bài blog trên toàn quốc :) (nhưng đã thất bại thảm hại..). Hiện tại, tôi đang là nghiên cứu sinh tiến sĩ chuyên ngành trí tuệ nhân tạo.

Tôi đã từng phát triển và tạo ra một ứng dụng gợi ý quán ăn ngon bằng cách thu thập danh sách các quán ăn và blog trên toàn quốc :) (nhưng đã thất bại thảm hại..). Hiện tại, tôi đang là nghiên cứu sinh tiến sĩ chuyên ngành trí tuệ nhân tạo.

Chương trình giảng dạy

Tất cả

14 bài giảng ∙ (3giờ 16phút)

Tài liệu khóa học:

Tài liệu bài giảng
Ngày đăng: 
Cập nhật lần cuối: 

Đánh giá

Tất cả

5 đánh giá

3.2

5 đánh giá

  • dhlim8093님의 프로필 이미지
    dhlim8093

    Đánh giá 1

    Đánh giá trung bình 4.0

    4

    100% đã tham gia

    Đó là một bài giảng tốt.

    • gdkmh81211306님의 프로필 이미지
      gdkmh81211306

      Đánh giá 2

      Đánh giá trung bình 5.0

      5

      36% đã tham gia

      Tôi đã mua rất nhiều vì tôi nhận được rất nhiều sự trợ giúp từ việc phân tích mạng lưới. ước gì có nhiều bài giảng hơn

      • indigo님의 프로필 이미지
        indigo

        Đánh giá 5

        Đánh giá trung bình 3.8

        1

        100% đã tham gia

        Nội dung bài giảng và cách diễn đạt của giảng viên rất nghèo nàn. Bạn thậm chí còn không tải lên mã nguồn cho phần Word2Vec. Vì bài giảng được tiến hành một cách ngẫu hứng mà không có sự chuẩn bị trước nên bản thân bài giảng có vẻ thiếu tổ chức. Và nếu bạn chuyển bài giảng của người này thành văn bản và thực hiện phân tích tần suất, bạn có thể sẽ nhận được ' Có vẻ như từ này sẽ chiếm vị trí đầu tiên. Nghe mà khó chịu.

        • 3812kim2408님의 프로필 이미지
          3812kim2408

          Đánh giá 4

          Đánh giá trung bình 3.5

          3

          21% đã tham gia

          Nó chỉ như thế thôi

          • gooddoctor8228님의 프로필 이미지
            gooddoctor8228

            Đánh giá 17

            Đánh giá trung bình 4.6

            3

            36% đã tham gia

            Bài giảng hay quá. Chỉ tiếc là không phải Python.

            705.360 ₫

            Khóa học khác của coco

            Hãy khám phá các khóa học khác của giảng viên!

            Khóa học tương tự

            Khám phá các khóa học khác trong cùng lĩnh vực!