Inflearn brand logo image
Inflearn brand logo image
Inflearn brand logo image
Data Science

/

Data Analysis

Khai thác văn bản bằng R (từ các từ khóa hàng đầu đến phân tích tình cảm)

Đây là bài giảng trong đó bạn sẽ tìm hiểu các từ khóa/wordcloud/phân tích tình cảm/mô hình chủ đề hàng đầu của văn bản thông qua R.

(4.3) 11 đánh giá

299 học viên

  • coco
R
Web Crawling
Text Mining

Đánh giá từ những học viên đầu tiên

Dịch cái này sang tiếng Việt

  • Cách thực hiện phân tích hình thái

  • Trích xuất từ ​​khóa hàng đầu

  • Cách vẽ wordcloud đẹp

  • Phân tích tình cảm

  • Mô hình hóa chủ đề (LDA)

Trong biển dữ liệu đang đổ về
Hãy cùng tạo ra một số thông tin giống như viên ngọc quý! 💎

Khai thác văn bản là gì? 🤔

Khai thác văn bản là một quá trình khai thác dữ liệu phi cấu trúc. Khai thác bao gồm việc trích xuất các khái niệm có ý nghĩa thống kê và trích xuất thông tin thông qua các mẫu hình bên trong chúng. Khai thác văn bản đề cập đến việc khai thác dữ liệu phi cấu trúc như video, tin nhắn và thông tin vị trí . Tuy nhiên, dữ liệu phi cấu trúc thiếu định dạng xác định, khiến việc thu thập dữ liệu trở nên khó khăn.

Trong bài giảng này, bạn sẽ học cách xử lý dữ liệu phi cấu trúc, một vấn đề ngày càng trở nên quan trọng do sự phát triển của mạng xã hội!


Bạn sẽ học được gì? 📖

1. Trích xuất các từ khóa hàng đầu / Vẽ một WordCloud đẹp

Tìm hiểu về KoNLP, một công cụ phân tích hình thái, trích xuất các từ khóa hàng đầu và tạo đám mây từ.



2. Thử phân tích tình cảm dựa trên từ điển/học máy.

Tìm hiểu cách xây dựng từ điển của riêng bạn để thực hiện phân tích tình cảm và cách thực hiện bằng cách sử dụng phân tích hồi quy (học máy).

Phân tích tình cảm là gì?

Phân tích cảm xúc là một quá trình định lượng thông tin chủ quan, chẳng hạn như cảm xúc hoặc ý kiến, chứa trong văn bản, dựa trên từ ngữ và ngữ cảnh . Phân tích cảm xúc cũng được sử dụng tích cực trong kinh doanh, chẳng hạn như thu thập và khai thác ý kiến của người tiêu dùng về sản phẩm và dịch vụ. Phân tích cảm xúc cũng là một loại công nghệ khai thác văn bản.

3. Mô hình chủ đề


Bài giảng liên quan 🖋️

  • Bạn có thể học các kỹ thuật bò cơ bản.
  • Bạn nên nghiên cứu điều này trước khi tham gia khóa học này.
  • Nhấp vào hình ảnh để đi tới bài giảng đó.

Những câu hỏi dự kiến 🙋‍♀️

H. Sinh viên không chuyên ngành cũng có thể tham gia khóa học này không?

Khóa học này yêu cầu bạn phải có hiểu biết cơ bản về ngôn ngữ R. Những ai đã học khóa "Giới thiệu về Thu thập dữ liệu Web với R" sẽ thấy khóa học này rất dễ hiểu.

Khuyến nghị cho
những người này

Khóa học này dành cho ai?

  • Bất kỳ ai muốn khai thác văn bản bằng R

  • Những người đã tham gia khóa học bò

Xin chào
Đây là

8,274

Học viên

500

Đánh giá

136

Trả lời

4.4

Xếp hạng

20

Các khóa học

학부에서는 통계학을 전공하고 산업공학(인공지능) 박사를 받고 여전히 공부중인 백수입니다.

 

수상

ㆍ 제6회 빅콘테스트 게임유저이탈 알고리즘 개발 / 엔씨소프트상(2018)

ㆍ 제5회 빅콘테스트 대출 연체자 예측 알고리즘개발 / 한국정보통신진흥협회장상(2017)

ㆍ 2016 날씨 빅데이터 콘테스트/ 기상산업 진흥원장상(2016) 

ㆍ 제4회 빅콘테스트 보험사기 예측 알고리즘 개발 / 본선진출(2016)

ㆍ 제3회 빅콘테스트 야구 경기 예측 알고리즘 개발 / 미래창조과학부 장관상(2015)

* blog : https://bluediary8.tistory.com

주로 연구하는 분야는 데이터 사이언스, 강화학습, 딥러닝 입니다.

크롤링과 텍스트마이닝은 현재는 취미로 하고있습니다 :) 

크롤링을 이용해서 인기있는 커뮤니티 글만 수집해서 보여주는 마롱이라는 앱을 개발하였고

전국의 맛집리스트와 블로그를 수집해서 맛집 추천 앱도 만들었었죠 :) (시원하게 말아먹..)

지금은 인공지능을 연구하는 박사과정생입니다.

 

 

 

 

Chương trình giảng dạy

Tất cả

13 bài giảng ∙ (4giờ 10phút)

Tài liệu khóa học:

Tài liệu bài giảng
Ngày đăng: 
Cập nhật lần cuối: 

Đánh giá

Tất cả

11 đánh giá

4.3

11 đánh giá

  • Hyejin Kwon님의 프로필 이미지
    Hyejin Kwon

    Đánh giá 3

    Đánh giá trung bình 5.0

    5

    100% đã tham gia

    사실 실습만 같이 하면서 하니까 좋기도 하지만 아직 미숙한 시점에선 함번만에 따라가면서 하기는 어려웠어요 그래도 반복해서 보면 좋을거 같구요 한국어 텍스트 분석 특히 토픽과 감성분석을 온라인 가으이로 들을 수 있는 곳이 많지 않아서 중요한 강의가 되지 않았나 싶어요 한번 더 보면서 하면 조금 더 이해하고 직접 코드 활용할 수 있을꺼 같아요 긜고 자료로 코드를 미리 다 주셔서 너무 좋았습니다.

    • 아쿠아라이드님의 프로필 이미지
      아쿠아라이드

      Đánh giá 12

      Đánh giá trung bình 5.0

      5

      100% đã tham gia

      R 기계학습을 study 하고 업무에 적용하고 있는 사람으로서 단지 텍스타마이닝 뿐 아니라 전반적인 기계학습 개념 이해, 그리고 R 코딩 스킬 향상에도 정말 도움 많이 되는, 실무적용성과 실력향상 두 가지를 동시에 잡을 수 있는 가성비 최고의 강의라 할 수 있겠습니다. 맨 마지막 강의인 LDA 내용도 조금 어렵긴 했지만.. 나중에 유사한 분석 필요 상황이 있다면 강의 다시 돌려 보면서 적용 가능할 듯 하네요~~ 수준높은 강의를 아주 저렴한 가격에 제공해 주신 강사님께 큰 감사드리며... 다음 강의 때 또 뵙겠습니다 ㅎㅎ

      • DT로님의 프로필 이미지
        DT로

        Đánh giá 4

        Đánh giá trung bình 5.0

        5

        100% đã tham gia

        보고서, 업무 수행 시 키워드 분석을 해서 중요한 키워드로 정리도 해 보았네요. 감성분석을 통해 머신러닝의 수치 factor에 대해서도 익히는 좋은 수업이 되었습니다. 추천합니다.

        • HM K_cat님의 프로필 이미지
          HM K_cat

          Đánh giá 10

          Đánh giá trung bình 5.0

          5

          100% đã tham gia

          강사님 강의 중 벌써 4개를 신청해서 듣고 있습니다. R로 텍스트마이닝과 감성분석을 이해하는 데 많은 도움이 됩니다. 다만 아쉬운 점은 직접 코딩하다가 코드를 카피해오고, 실행하는 화면에서 왔다갔다 하다보니 산만하다는 것입니다. 강사님께서 편집작업을 하신 후에 설명을 해주시면 좋을 것 같습니다.^^

          • 이건희님의 프로필 이미지
            이건희

            Đánh giá 3

            Đánh giá trung bình 5.0

            5

            100% đã tham gia

            너무 좋은 강의입니다!! 코코님 강의 또 듣고싶네요 ㅎㅎ 다음 강의도 꼭 듣고 싶어요

            • 코코
              Giảng viên

              좋은 후기 항상 감사합니다. 도움이 되셨으면 좋겠습니다 :)

          925.315 ₫

          Khóa học khác của coco

          Hãy khám phá các khóa học khác của giảng viên!

          Khóa học tương tự

          Khám phá các khóa học khác trong cùng lĩnh vực!