강의

멘토링

로드맵

BEST
Data Science

/

Data Analysis

[NLP] Phân tích văn bản Python và xử lý ngôn ngữ tự nhiên thông qua phân tích cảm xúc đánh giá phim IMDB

Đây là khóa học giúp bạn thực hành và làm quen với các lý thuyết và thực hành cơ bản về xử lý ngôn ngữ tự nhiên thông qua cuộc thi phân tích cảm xúc đánh giá phim IMDB trên Kaggle.

(4.6) 41 đánh giá

2,762 học viên

  • todaycode
Python
NLP

Đánh giá từ những học viên đầu tiên

Dịch cái này sang tiếng Việt

  • Xử lý ngôn ngữ tự nhiên (NLP)

  • Xử lý trước dữ liệu văn bản (chuẩn hóa, phân tách thành các từ, phân tích gốc từ, phân tích các đơn vị ngữ pháp, trích xuất gốc từ, ký hiệu âm vị)

  • Kỹ thuật trực quan hóa dữ liệu văn bản (Matplotlib, Seaborn), học máy (Scikit-learn)

  • Học sâu/máy học, phân tích dữ liệu

  • Python chuẩn thư viện thông qua thực hiện đơn giản của Perceptron

  • Học trực tuyến, khái niệm Vowpal Wabbit

  • Nhiều kỹ thuật vectơ hóa dữ liệu văn bản (Bag of Words, n-gram, TF-IDF, Word2Vec)

  • Tối ưu hóa hiệu suất thông qua việc triển khai đường ống

  • Các kỹ thuật Ensemble (Random Forest) và Boosting (Xgboost)

Phân tích tình cảm bằng máy học trong đánh giá phim 🎞️
Từ xử lý dữ liệu trước cho đến đánh giá và dự đoán!

Lý thuyết và thực hành xử lý ngôn ngữ tự nhiên
Bạn muốn học tất cả cùng một lúc? 👩‍💻

Khóa học này bao gồm các lý thuyết và thực hành cơ bản cần thiết cho xử lý ngôn ngữ tự nhiên thông qua cuộc thi phân tích tình cảm đánh giá phim IMDB trên Kaggle. Xử lý ngôn ngữ tự nhiên được sử dụng rộng rãi trong chatbot, phân tích văn bản và xử lý dữ liệu trước khi phát triển các mô hình học máy/học sâu.

Nó bao gồm xử lý ngôn ngữ tự nhiên, nhưng cũng bao gồm xử lý dữ liệu trước, nhiều kỹ thuật học máy và kỹ thuật học sâu, và cũng xem xét các cách sử dụng học có giám sát và học không giám sát. Ngoài các hướng dẫn cơ bản về Kaggle, chúng tôi sẽ đề cập đến các chủ đề bổ sung như trực quan hóa dữ liệu văn bản, xử lý trước và cải thiện hiệu suất thông qua xử lý song song qua đường ống. Chúng ta cùng nhau thực hiện thử thách này nhé?

Trước tiên hãy xem hướng dẫn bài giảng!

Bài giảng này
Những người hữu ích 🔍

phức tap
Từ dữ liệu văn bản
Để tìm ý nghĩa
Người làm điều đó

Để phát triển
Xử lý ngôn ngữ tự nhiên
Muốn học
Nhà phát triển Chatbot

Cần thiết cho phân tích tình cảm
Nhiều kỹ thuật khác nhau
Muốn học
Nhà phân tích dữ liệu

Học máy/học sâu,
NLP, v.v.
Dễ dàng và vui vẻ
Dành cho những ai muốn bắt đầu


Nếu bạn lắng nghe bài giảng
Bạn có thể làm gì? 📌

Bạn có thể tìm hiểu các kỹ thuật phân loại của máy học bằng cách sử dụng dữ liệu đánh giá phim IMDB. Bạn sẽ học cách áp dụng phương pháp học có giám sát và không giám sát vào học máy . Học có giám sát liên quan đến phân tích tình cảm bằng cách sử dụng máy học, trong khi học không giám sát liên quan đến kỹ thuật giảm chiều và phân cụ.

  • Xử lý ngôn ngữ tự nhiên (NLP: Lập trình ngôn ngữ thần kinh)
  • Tiền xử lý dữ liệu văn bản (chuẩn hóa, mã hóa, tách từ, phân tích hình thái, trích xuất gốc, ký hiệu ngữ âm)
  • Phân tích dữ liệu
  • Kỹ thuật trực quan hóa dữ liệu văn bản (Matplotlib, Seaborn)
  • Học máy (Scikit-learn) và Học sâu
  • Triển khai Perceptron đơn giản bằng cách sử dụng thư viện chuẩn Python
  • Học trực tuyến, Khái niệm Vowpal Wabbit
  • Nhiều kỹ thuật vector hóa dữ liệu văn bản khác nhau (Bag of Words, n-gram, TF-IDF, Word2Vec)
  • Tối ưu hóa hiệu suất thông qua việc triển khai đường ống
  • Kỹ thuật Ensemble (Random Forest) và Boosting (Xgboost)

📣 Vui lòng kiểm tra trước khi tham gia lớp học!

  • Chúng tôi khuyên bạn nên học khóa học trong môi trường có bộ nhớ 4GB trở lên và CPU lõi kép hoặc cao hơn .
  • Nếu hiệu suất của thiết bị của bạn hơi kém vì quá trình xử lý dữ liệu văn bản mất nhiều thời gian, vui lòng thực hành thông qua liên kết Google Colaboratory ở cuối video!

Đã tạo khóa học này
Bạn có tò mò về người chia sẻ kiến ​​thức không? 👩‍💻

Người chia sẻ kiến ​​thức Park Jo-eun X Phỏng vấn Inflearn

Khuyến nghị cho
những người này

Khóa học này dành cho ai?

  • Những người muốn tìm kiếm ý nghĩa từ dữ liệu văn bản phức tạp.

  • Nhà phát triển chatbot, nhà phân tích dữ liệu, người mới bắt đầu về máy học, học sâu

Cần biết trước khi bắt đầu?

  • Phân tích dữ liệu Python Pandas

  • Cơ sở về máy học/học sâu

Xin chào
Đây là

18,881

Học viên

792

Đánh giá

1,334

Trả lời

4.9

Xếp hạng

6

Các khóa học

  • Microsoft MVP(Python Developer Technologies)

  • 오늘코드 YouTube 📺 https://youtube.com/todaycode

  • “모두가 데이터에 친숙해지는 날이 오길”– 마이크로소프트웨어 (링크)

  • 네이버 커넥트 재단 부스트코스 데이터사이언스 강의 설계 및 교수자

  • 서울대 빅데이터혁신공유대학, 서울대 평생교육원, 연세대 DX Academy, 한신대 ABC Camp, 한양대 대학원, 전남대,

    한국능률협회, 삼성SDS 멀티캠퍼스, 멋쟁이사자처럼, 패스트캠퍼스, 모두의연구소 등 다수의 교육기관 및 기업 강의

  • 다양한 도메인(제약, 통신, 자동차, 커머스, 교육, 정부기관 등)의 기업 데이터 분석

  • 20년이상 게임, 광고, 교육 등 다양한 도메인에서 웹 백엔드 개발자 및 데이터 분석가 현업 경험

Chương trình giảng dạy

Tất cả

17 bài giảng ∙ (3giờ 30phút)

Ngày đăng: 
Cập nhật lần cuối: 

Đánh giá

Tất cả

41 đánh giá

4.6

41 đánh giá

  • crecengu님의 프로필 이미지
    crecengu

    Đánh giá 1

    Đánh giá trung bình 5.0

    5

    76% đã tham gia

    선생님 강의 잘 보고 있습니다. 이번에 영화 분석 강의 수강 하려고 하는데, 강의 자료는 어디서 받을 수 있을까요~?

    • 주재홍님의 프로필 이미지
      주재홍

      Đánh giá 8

      Đánh giá trung bình 5.0

      5

      65% đã tham gia

      친절한 설명 좋네요

      • Youngmin Kim님의 프로필 이미지
        Youngmin Kim

        Đánh giá 7

        Đánh giá trung bình 5.0

        5

        100% đã tham gia

        자세한 설명과 예제와 리소스, 첨부 등으로 강의보다 훨씬 더 많은 것을 얻어가는 듯 합니다. 감사합니다.

        • 나대엽님의 프로필 이미지
          나대엽

          Đánh giá 10

          Đánh giá trung bình 5.0

          5

          100% đã tham gia

          감사합니다.

          • 피넛버터제임이님의 프로필 이미지
            피넛버터제임이

            Đánh giá 3

            Đánh giá trung bình 4.0

            4

            100% đã tham gia

            초심자가 듣기에는 조금 어렵지만 유익했습니다!

            Truy cập bị hạn chế đối với các khóa học không công khai.
            Khóa học riêng tư

            Khóa học khác của todaycode

            Hãy khám phá các khóa học khác của giảng viên!

            Khóa học tương tự

            Khám phá các khóa học khác trong cùng lĩnh vực!