강의

멘토링

커뮤니티

Data Science

/

Data Analysis

Khai thác văn bản bằng R (từ các từ khóa hàng đầu đến phân tích tình cảm)

Đây là bài giảng trong đó bạn sẽ tìm hiểu các từ khóa/wordcloud/phân tích tình cảm/mô hình chủ đề hàng đầu của văn bản thông qua R.

(4.3) 11 đánh giá

302 học viên

Độ khó Cơ bản

Thời gian Không giới hạn

  • coco
R
R
Web Crawling
Web Crawling
Text Mining
Text Mining
R
R
Web Crawling
Web Crawling
Text Mining
Text Mining

Đánh giá từ những học viên đầu tiên

Đánh giá từ những học viên đầu tiên

4.3

5.0

Hyejin Kwon

100% đã tham gia

Thực ra, thật tuyệt khi được luyện tập cùng nhau. Khi tôi vẫn còn thiếu kinh nghiệm, thật khó để làm theo. Tuy nhiên, tôi nghĩ sẽ rất tốt nếu xem đi xem lại. Tôi nghĩ đó là một bài giảng quan trọng vì không có nhiều nơi bạn có thể nghe phân tích văn bản tiếng Hàn, đặc biệt là phân tích chủ đề và tình cảm, trực tuyến. Tôi nghĩ nếu bạn xem lại một lần nữa, bạn sẽ hiểu rõ hơn một chút và có thể tự mình sử dụng mã. Thật tuyệt khi họ đã cung cấp trước cho tôi tất cả mã.

5.0

아쿠아라이드

100% đã tham gia

Là một người nghiên cứu R machine learning và áp dụng nó vào công việc, Hiểu các khái niệm máy học tổng thể, không chỉ khai thác văn bản, Và nó thực sự hữu ích trong việc cải thiện kỹ năng viết mã R. Có thể đạt được cả ứng dụng thực tế và cải thiện kỹ năng cùng một lúc Có thể nói đây là khóa học tiết kiệm chi phí tốt nhất. Bài giảng cuối cùng, LDA, hơi khó, nhưng... Nếu có nhu cầu phân tích tương tự trong tương lai Tôi nghĩ tôi có thể áp dụng nó trong khi xem lại bài giảng~~ Để cung cấp các bài giảng chất lượng cao với giá cả rất phải chăng. Cảm ơn người hướng dẫn rất nhiều... Hẹn gặp lại bạn ở bài giảng tiếp theo.

5.0

DT로

100% đã tham gia

Khi thực hiện báo cáo và nhiệm vụ, tôi phân tích từ khóa và sắp xếp chúng thành những từ khóa quan trọng. Đó là một lớp học hay để tìm hiểu về các yếu tố số trong học máy thông qua phân tích cảm xúc. Khuyến khích.

Bạn sẽ nhận được điều này sau khi học.

  • Cách thực hiện phân tích hình thái

  • Trích xuất từ ​​khóa hàng đầu

  • Cách vẽ wordcloud đẹp

  • Phân tích tình cảm

  • Mô hình hóa chủ đề (LDA)

Trong biển dữ liệu đang đổ về
Hãy cùng tạo ra một số thông tin giống như viên ngọc quý! 💎

Khai thác văn bản là gì? 🤔

Khai thác văn bản là một quá trình khai thác dữ liệu phi cấu trúc. Khai thác bao gồm việc trích xuất các khái niệm có ý nghĩa thống kê và trích xuất thông tin thông qua các mẫu hình bên trong chúng. Khai thác văn bản đề cập đến việc khai thác dữ liệu phi cấu trúc như video, tin nhắn và thông tin vị trí . Tuy nhiên, dữ liệu phi cấu trúc thiếu định dạng xác định, khiến việc thu thập dữ liệu trở nên khó khăn.

Trong bài giảng này, bạn sẽ học cách xử lý dữ liệu phi cấu trúc, một vấn đề ngày càng trở nên quan trọng do sự phát triển của mạng xã hội!


Bạn sẽ học được gì? 📖

1. Trích xuất các từ khóa hàng đầu / Vẽ một WordCloud đẹp

Tìm hiểu về KoNLP, một công cụ phân tích hình thái, trích xuất các từ khóa hàng đầu và tạo đám mây từ.



2. Thử phân tích tình cảm dựa trên từ điển/học máy.

Tìm hiểu cách xây dựng từ điển của riêng bạn để thực hiện phân tích tình cảm và cách thực hiện bằng cách sử dụng phân tích hồi quy (học máy).

Phân tích tình cảm là gì?

Phân tích cảm xúc là một quá trình định lượng thông tin chủ quan, chẳng hạn như cảm xúc hoặc ý kiến, chứa trong văn bản, dựa trên từ ngữ và ngữ cảnh . Phân tích cảm xúc cũng được sử dụng tích cực trong kinh doanh, chẳng hạn như thu thập và khai thác ý kiến của người tiêu dùng về sản phẩm và dịch vụ. Phân tích cảm xúc cũng là một loại công nghệ khai thác văn bản.

3. Mô hình chủ đề


Bài giảng liên quan 🖋️

  • Bạn có thể học các kỹ thuật bò cơ bản.
  • Bạn nên nghiên cứu điều này trước khi tham gia khóa học này.
  • Nhấp vào hình ảnh để đi tới bài giảng đó.

Những câu hỏi dự kiến 🙋‍♀️

H. Sinh viên không chuyên ngành cũng có thể tham gia khóa học này không?

Khóa học này yêu cầu bạn phải có hiểu biết cơ bản về ngôn ngữ R. Những ai đã học khóa "Giới thiệu về Thu thập dữ liệu Web với R" sẽ thấy khóa học này rất dễ hiểu.

Khuyến nghị cho
những người này

Khóa học này dành cho ai?

  • Bất kỳ ai muốn khai thác văn bản bằng R

  • Những người đã tham gia khóa học bò

Xin chào
Đây là

8,390

Học viên

509

Đánh giá

136

Trả lời

4.4

Xếp hạng

20

Các khóa học

Tôi là một người thất nghiệp vẫn đang tiếp tục học tập, sau khi tốt nghiệp cử nhân chuyên ngành Thống kê và nhận bằng Tiến sĩ Kỹ thuật Công nghiệp (Trí tuệ nhân tạo).

Giải thưởng

ㆍ Cuộc thi Big Contest lần thứ 6: Phát triển thuật toán dự đoán người dùng rời bỏ trò chơi / Giải thưởng NCSOFT (2018)

ㆍ Cuộc thi Big Contest lần thứ 5 - Phát triển thuật toán dự đoán người nợ quá hạn khoản vay / Giải thưởng của Chủ tịch Hiệp hội Xúc tiến Công nghệ Thông tin và Truyền thông Hàn Quốc (2017)

ㆍ Cuộc thi Big Data Thời tiết 2016 / Giải thưởng của Viện trưởng Viện Thúc đẩy Công nghiệp Khí tượng (2016)

ㆍ Phát triển thuật toán dự đoán gian lận bảo hiểm tại Big Contest lần thứ 4 / Lọt vào vòng chung kết (2016)

ㆍ Cuộc thi Big Contest lần thứ 3: Phát triển thuật toán dự đoán trận đấu bóng chày / Giải thưởng của Bộ trưởng Bộ Khoa học, Công nghệ thông tin và Hoạch định tương lai (2015)

* blog : https://bluediary8.tistory.com

Lĩnh vực nghiên cứu chính của tôi là khoa học dữ liệu, học tăng cường và học sâu.

Hiện tại tôi đang thực hiện việc thu thập dữ liệu (crawling) và khai phá văn bản (text mining) như một sở thích :)

Tôi đã phát triển một ứng dụng có tên là Marong, sử dụng kỹ thuật crawling để thu thập và hiển thị những bài viết phổ biến từ các cộng đồng trực tuyến, và

Tôi cũng từng thu thập danh sách các quán ăn ngon và blog trên toàn quốc để tạo ra một ứng dụng gợi ý quán ăn :) (nhưng rồi cũng thất bại thảm hại..)

Hiện tại, tôi đang là nghiên cứu sinh tiến sĩ chuyên nghiên cứu về trí tuệ nhân tạo.

Tôi đã từng phát triển và tạo ra một ứng dụng gợi ý quán ăn ngon bằng cách thu thập danh sách các nhà hàng và blog ẩm thực trên toàn quốc :) (nhưng đã thất bại thảm hại..). Hiện tại, tôi đang là nghiên cứu sinh tiến sĩ chuyên ngành trí tuệ nhân tạo.

Tôi đã từng phát triển và tạo ra một ứng dụng gợi ý quán ăn ngon bằng cách thu thập danh sách các quán ăn và blog trên toàn quốc :) (nhưng đã thất bại thảm hại..). Hiện tại, tôi đang là nghiên cứu sinh tiến sĩ chuyên ngành trí tuệ nhân tạo.

Tôi đã từng phát triển và tạo ra một ứng dụng gợi ý quán ăn ngon bằng cách thu thập danh sách các quán ăn cũng như các bài blog trên toàn quốc :) (nhưng đã thất bại thảm hại..). Hiện tại, tôi đang là nghiên cứu sinh tiến sĩ chuyên ngành trí tuệ nhân tạo.

Tôi đã từng phát triển và tạo ra một ứng dụng gợi ý quán ăn ngon bằng cách thu thập danh sách các quán ăn và blog trên toàn quốc :) (nhưng đã thất bại thảm hại..). Hiện tại, tôi đang là nghiên cứu sinh tiến sĩ chuyên ngành trí tuệ nhân tạo.

Chương trình giảng dạy

Tất cả

13 bài giảng ∙ (4giờ 10phút)

Tài liệu khóa học:

Tài liệu bài giảng
Ngày đăng: 
Cập nhật lần cuối: 

Đánh giá

Tất cả

11 đánh giá

4.3

11 đánh giá

  • hjsjforever5083님의 프로필 이미지
    hjsjforever5083

    Đánh giá 3

    Đánh giá trung bình 5.0

    5

    100% đã tham gia

    Thực ra, thật tuyệt khi được luyện tập cùng nhau. Khi tôi vẫn còn thiếu kinh nghiệm, thật khó để làm theo. Tuy nhiên, tôi nghĩ sẽ rất tốt nếu xem đi xem lại. Tôi nghĩ đó là một bài giảng quan trọng vì không có nhiều nơi bạn có thể nghe phân tích văn bản tiếng Hàn, đặc biệt là phân tích chủ đề và tình cảm, trực tuyến. Tôi nghĩ nếu bạn xem lại một lần nữa, bạn sẽ hiểu rõ hơn một chút và có thể tự mình sử dụng mã. Thật tuyệt khi họ đã cung cấp trước cho tôi tất cả mã.

    • aquarid22님의 프로필 이미지
      aquarid22

      Đánh giá 12

      Đánh giá trung bình 5.0

      5

      100% đã tham gia

      Là một người nghiên cứu R machine learning và áp dụng nó vào công việc, Hiểu các khái niệm máy học tổng thể, không chỉ khai thác văn bản, Và nó thực sự hữu ích trong việc cải thiện kỹ năng viết mã R. Có thể đạt được cả ứng dụng thực tế và cải thiện kỹ năng cùng một lúc Có thể nói đây là khóa học tiết kiệm chi phí tốt nhất. Bài giảng cuối cùng, LDA, hơi khó, nhưng... Nếu có nhu cầu phân tích tương tự trong tương lai Tôi nghĩ tôi có thể áp dụng nó trong khi xem lại bài giảng~~ Để cung cấp các bài giảng chất lượng cao với giá cả rất phải chăng. Cảm ơn người hướng dẫn rất nhiều... Hẹn gặp lại bạn ở bài giảng tiếp theo.

      • psangkuk6551님의 프로필 이미지
        psangkuk6551

        Đánh giá 4

        Đánh giá trung bình 5.0

        5

        100% đã tham gia

        Khi thực hiện báo cáo và nhiệm vụ, tôi phân tích từ khóa và sắp xếp chúng thành những từ khóa quan trọng. Đó là một lớp học hay để tìm hiểu về các yếu tố số trong học máy thông qua phân tích cảm xúc. Khuyến khích.

        • softjara0875님의 프로필 이미지
          softjara0875

          Đánh giá 10

          Đánh giá trung bình 5.0

          5

          100% đã tham gia

          Tôi đã đăng ký và đang tham gia bốn bài giảng của người hướng dẫn. Nó rất hữu ích trong việc hiểu việc khai thác văn bản và phân tích tình cảm với R. Tuy nhiên, điều đáng tiếc là việc sao chép mã trong khi tự viết mã và quay đi quay lại trên màn hình thực thi sẽ gây mất tập trung. Sẽ rất tốt nếu người hướng dẫn có thể giải thích sau khi chỉnh sửa. ^^

          • geonhee2720836님의 프로필 이미지
            geonhee2720836

            Đánh giá 3

            Đánh giá trung bình 5.0

            5

            100% đã tham gia

            Đây là một bài giảng rất hay!! Tôi muốn nghe lại bài giảng của Coco haha. Tôi chắc chắn cũng muốn nghe bài giảng tiếp theo.

            • coco
              Giảng viên

              Cảm ơn bạn luôn luôn cho những đánh giá tốt. Tôi hy vọng nó có ích :)

          911.091 ₫

          Khóa học khác của coco

          Hãy khám phá các khóa học khác của giảng viên!

          Khóa học tương tự

          Khám phá các khóa học khác trong cùng lĩnh vực!