[NLP] Phân tích văn bản Python và xử lý ngôn ngữ tự nhiên thông qua phân tích cảm xúc đánh giá phim IMDB
Đây là khóa học giúp bạn thực hành và làm quen với các lý thuyết và thực hành cơ bản về xử lý ngôn ngữ tự nhiên thông qua cuộc thi phân tích cảm xúc đánh giá phim IMDB trên Kaggle.
Xử lý trước dữ liệu văn bản (chuẩn hóa, phân tách thành các từ, phân tích gốc từ, phân tích các đơn vị ngữ pháp, trích xuất gốc từ, ký hiệu âm vị)
Kỹ thuật trực quan hóa dữ liệu văn bản (Matplotlib, Seaborn), học máy (Scikit-learn)
Học sâu/máy học, phân tích dữ liệu
Python chuẩn thư viện thông qua thực hiện đơn giản của Perceptron
Học trực tuyến, khái niệm Vowpal Wabbit
Nhiều kỹ thuật vectơ hóa dữ liệu văn bản (Bag of Words, n-gram, TF-IDF, Word2Vec)
Tối ưu hóa hiệu suất thông qua việc triển khai đường ống
Các kỹ thuật Ensemble (Random Forest) và Boosting (Xgboost)
Phân tích tình cảm bằng máy học trong đánh giá phim 🎞️ Từ xử lý dữ liệu trước cho đến đánh giá và dự đoán!
Lý thuyết và thực hành xử lý ngôn ngữ tự nhiên Bạn muốn học tất cả cùng một lúc? 👩💻
Khóa học này bao gồm các lý thuyết và thực hành cơ bản cần thiết cho xử lý ngôn ngữ tự nhiên thông qua cuộc thi phân tích tình cảm đánh giá phim IMDB trên Kaggle. Xử lý ngôn ngữ tự nhiên được sử dụng rộng rãi trong chatbot, phân tích văn bản và xử lý dữ liệu trước khi phát triển các mô hình học máy/học sâu.
Nó bao gồm xử lý ngôn ngữ tự nhiên, nhưng cũng bao gồm xử lý dữ liệu trước, nhiều kỹ thuật học máy và kỹ thuật học sâu, và cũng xem xét các cách sử dụng học có giám sát và học không giám sát. Ngoài các hướng dẫn cơ bản về Kaggle, chúng tôi sẽ đề cập đến các chủ đề bổ sung như trực quan hóa dữ liệu văn bản, xử lý trước và cải thiện hiệu suất thông qua xử lý song song qua đường ống. Chúng ta cùng nhau thực hiện thử thách này nhé?
Trước tiên hãy xem hướng dẫn bài giảng!
Bài giảng này Những người hữu ích 🔍
phức tap Từ dữ liệu văn bản Để tìm ý nghĩa Người làm điều đó
Để phát triển Xử lý ngôn ngữ tự nhiên Muốn học Nhà phát triển Chatbot
Cần thiết cho phân tích tình cảm Nhiều kỹ thuật khác nhau Muốn học Nhà phân tích dữ liệu
Học máy/học sâu, NLP, v.v. Dễ dàng và vui vẻ Dành cho những ai muốn bắt đầu
Nếu bạn lắng nghe bài giảng Bạn có thể làm gì? 📌
Bạn có thể tìm hiểu các kỹ thuật phân loại của máy học bằng cách sử dụng dữ liệu đánh giá phim IMDB. Bạn sẽ học cách áp dụng phương pháp học có giám sát và không giám sát vào học máy . Học có giám sát liên quan đến phân tích tình cảm bằng cách sử dụng máy học, trong khi học không giám sát liên quan đến kỹ thuật giảm chiều và phân cụ.
Xử lý ngôn ngữ tự nhiên (NLP: Lập trình ngôn ngữ thần kinh)
Tiền xử lý dữ liệu văn bản (chuẩn hóa, mã hóa, tách từ, phân tích hình thái, trích xuất gốc, ký hiệu ngữ âm)
Phân tích dữ liệu
Kỹ thuật trực quan hóa dữ liệu văn bản (Matplotlib, Seaborn)
Học máy (Scikit-learn) và Học sâu
Triển khai Perceptron đơn giản bằng cách sử dụng thư viện chuẩn Python
Học trực tuyến, Khái niệm Vowpal Wabbit
Nhiều kỹ thuật vector hóa dữ liệu văn bản khác nhau (Bag of Words, n-gram, TF-IDF, Word2Vec)
Tối ưu hóa hiệu suất thông qua việc triển khai đường ống
Kỹ thuật Ensemble (Random Forest) và Boosting (Xgboost)
📣 Vui lòng kiểm tra trước khi tham gia lớp học!
Chúng tôi khuyên bạn nên học khóa học trong môi trường có bộ nhớ 4GB trở lên và CPU lõi kép hoặc cao hơn .
Nếu hiệu suất của thiết bị của bạn hơi kém vì quá trình xử lý dữ liệu văn bản mất nhiều thời gian, vui lòng thực hành thông qua liên kết Google Colaboratory ở cuối video!
Đã tạo khóa học này Bạn có tò mò về người chia sẻ kiến thức không? 👩💻
Người chia sẻ kiến thức Park Jo-eun X Phỏng vấn Inflearn
Khuyến nghị cho những người này
Khóa học này dành cho ai?
Những người muốn tìm kiếm ý nghĩa từ dữ liệu văn bản phức tạp.
Nhà phát triển chatbot, nhà phân tích dữ liệu, người mới bắt đầu về máy học, học sâu