
R로 하는 텍스트마이닝 (Top keyword부터 감성분석까지)
코코
R을 통해 텍스트의 top keyword / wordcloud / 감성분석 / Topic modeling까지 같이 차근차근 해보는 강의 입니다.
초급
R, 웹 크롤링, 텍스트마이닝
Lý thuyết và thực hành là khác nhau. Chúng tôi sẽ hiểu các khái niệm cơ bản về học máy và giới thiệu các khái niệm và lý thuyết cốt lõi của các mô hình khác nhau mà bạn phải biết. Và trong khi xử lý nhiều loại dữ liệu, chúng tôi chia sẻ nhiều kỹ thuật và bí quyết hữu ích trong thực tế.
Các khái niệm cơ bản về học máy và trí tuệ nhân tạo
phân tích hồi quy tuyến tính
Các khái niệm chính về mô hình học máy bạn cần biết
Kỹ thuật giải quyết vấn đề mất cân bằng lớp học
Các khái niệm và lý thuyết về phân tích cụm
Cách phân tích dữ liệu đúng cách
Bước đầu tiên dành cho các nhà khoa học dữ liệu mới bắt đầu!
Bạn muốn tìm hiểu các khái niệm cốt lõi cơ bản về học máy và trí tuệ nhân tạo? Khóa học này giới thiệu các khái niệm và lý thuyết cốt lõi cần thiết để trở thành một nhà khoa học dữ liệu, cũng như các kỹ thuật thực hành khác nhau .
Do đó, khóa học này tập trung vào các khái niệm cốt lõi thay vì các giải thích toán học, giúp người mới bắt đầu dễ hiểu hơn. Hơn nữa, chúng tôi chia sẻ các thách thức thực tế về xử lý dữ liệu, cùng với nhiều phương pháp và bí quyết khác nhau để giải quyết chúng.
Mô hình học máy
Các khái niệm và lý thuyết cốt lõi
Bất cứ ai muốn biết
Là một nhà khoa học dữ liệu
Phát triển nhanh
Bất cứ ai muốn
Những gì cần thiết trong thực tế
Kỹ thuật và bí quyết học máy
Những người muốn học
Khóa học được thiết kế sao cho sau khi hoàn thành , bạn sẽ có thể phân tích dữ liệu một cách chính xác với tư cách là một nhà khoa học dữ liệu . Hơn nữa, bạn sẽ có thể thiết kế các thí nghiệm phù hợp với miền dữ liệu của mình, lựa chọn biến và mô hình để nâng cao hiệu suất mô hình.
H. Tôi có cần nhiều kiến thức toán học để tham gia khóa học này không?
Yêu cầu có bằng thống kê ở trình độ đại học, nhưng không yêu cầu kiến thức trước.
H. Tôi có cần biết cách sử dụng R không?
Có, khóa học được tiến hành dựa trên giả định rằng bạn có một số kiến thức về R hoặc Python. Dưới đây
Xây dựng nền tảng cơ bản của lập trình R
Bạn mới làm quen với phân tích dữ liệu và lập trình R? Khóa học miễn phí
Từ kinh nghiệm
Kiến thức cốt lõi
quá trình lây truyền
sống động
Học hỏi
Mã hóa trực tiếp
nhiều
Với dữ liệu
Cảm giác thực tế Lên
Khóa đào tạo của chúng tôi không chỉ đơn thuần là giảng dạy các lý thuyết học máy và áp dụng chúng vào dữ liệu. Dựa trên kinh nghiệm từ bảy cuộc thi dữ liệu lớn (7 thí sinh lọt vào vòng chung kết, 5 người chiến thắng) và nhiều dự án khác nhau, chúng tôi nỗ lực cung cấp cho bạn kiến thức chuyên môn tốt nhất để phân tích dữ liệu hiệu quả.
Để minh họa quy trình phân tích dữ liệu của tôi, hầu hết các bài tập đều được thực hiện thông qua mã hóa trực tiếp. Tôi trình bày chi tiết cách tìm kiếm và áp dụng các khái niệm khi gặp vấn đề trong quá trình mã hóa. Tôi cũng chia sẻ các vấn đề gặp phải khi xử lý dữ liệu và các phương pháp tôi sử dụng để giải quyết chúng.
Chúng tôi sẽ đề cập đến nhiều loại dữ liệu. Bao gồm dữ liệu dự đoán giá nhà của Boston House, một ví dụ được sử dụng rộng rãi, dữ liệu mô phỏng với đa cộng tuyến mạnh, dự đoán đánh giá phim tích cực/tiêu cực (bằng tiếng Hàn), dữ liệu dự đoán giá thuê biệt thự tại Seoul và dữ liệu Kaggle Otto, cho phép bạn tích lũy kinh nghiệm thực tế.
Chúng ta sẽ tìm hiểu học máy là gì và những gì nó có thể làm. Chúng tôi cũng sẽ giải thích sự khác biệt giữa học máy và học sâu, đồng thời giới thiệu ngắn gọn các mô hình học máy và học sâu khác nhau. Chúng tôi cũng sẽ thảo luận về hiện tượng quá khớp (overfitting), một vấn đề phổ biến trong cả học máy và học sâu.
Khi học máy, mô hình đầu tiên bạn học luôn là mô hình hồi quy tuyến tính. Mặc dù là một mô hình đơn giản và dễ sử dụng, nhưng nó thường ít được sử dụng do hiệu suất kém. Tuy nhiên, các mô hình hồi quy tuyến tính được sử dụng rộng rãi trong công nghiệp và là một công cụ mạnh mẽ cho các bài toán hồi quy tuyến tính. Chúng ta sẽ tập trung vào các lý thuyết và khái niệm cơ bản nhất.
Khóa học này bao gồm các mô hình học máy thiết yếu. Thay vì tập trung vào các chi tiết toán học, bài giảng tập trung vào các khái niệm để dễ hiểu. Các mô hình ít được sử dụng hơn như cây quyết định và kNN, tuy không phổ biến như các mô hình độc lập, nhưng lại được sử dụng rộng rãi trong các lĩnh vực và mô hình khác. Do đó, chúng ta không bao giờ nên bỏ qua chúng. Bạn sẽ tìm hiểu các khái niệm và ứng dụng của nhiều mô hình khác nhau, và chúng tôi cũng sẽ giới thiệu ShapValue, một mô hình đang được chú ý như một ví dụ về eXplainable AI.
Vấn đề mất cân bằng lớp xảy ra thường xuyên hơn bạn nghĩ trong nhiều lĩnh vực, gây ra nhiều vấn đề khác nhau. Một ví dụ điển hình là sự suy giảm hiệu suất dự đoán do mô hình học tập thiên về nhiều lớp. Bài viết này giới thiệu các kỹ thuật khác nhau (phương pháp lấy mẫu lại) để giải quyết vấn đề này.
Phân tích dữ liệu không chỉ đơn thuần là đọc dữ liệu và điều chỉnh mô hình. Nó bao gồm việc tiền xử lý dữ liệu cơ bản, tạo ra các biến số chính để dự đoán giá trị Y, và triển khai thiết kế thử nghiệm phù hợp. Chúng tôi sẽ hướng dẫn bạn cách thiết kế thử nghiệm cho nhiều tình huống khác nhau và cung cấp kiến thức thiết yếu cần thiết cho một nhà khoa học dữ liệu.
"Có một khoảng cách đáng kể giữa lý thuyết và thực hành học máy. Thế giới chứa đầy những lĩnh vực và dữ liệu đa dạng, và việc phân tích dữ liệu đòi hỏi nhiều hơn là chỉ đào tạo một mô hình. Thiết kế thử nghiệm phù hợp với lĩnh vực, việc tạo ra các biến đạo hàm để nâng cao hiệu suất mô hình, và lựa chọn mô hình dựa trên mục tiêu phân tích là rất quan trọng.
Khóa học này giải thích các khái niệm và nguyên tắc cốt lõi của khoa học dữ liệu và trí tuệ nhân tạo một cách đơn giản, dễ hiểu, đồng thời cung cấp các mẹo và kiến thức thực tế. Tôi hy vọng khóa học này sẽ giúp bạn nâng cao kỹ năng và hiểu rõ hơn về phân tích dữ liệu.
Khóa học này dành cho ai?
Bất kỳ ai muốn biết các khái niệm và lý thuyết cốt lõi của mô hình học máy
Bất kỳ ai muốn phát triển nhanh chóng với tư cách là nhà khoa học dữ liệu
Cần biết trước khi bắt đầu?
Thống kê bậc đại học
Lập trình R cơ bản
8,274
Học viên
500
Đánh giá
136
Trả lời
4.4
Xếp hạng
20
Các khóa học
학부에서는 통계학을 전공하고 산업공학(인공지능) 박사를 받고 여전히 공부중인 백수입니다.
수상
ㆍ 제6회 빅콘테스트 게임유저이탈 알고리즘 개발 / 엔씨소프트상(2018)
ㆍ 제5회 빅콘테스트 대출 연체자 예측 알고리즘개발 / 한국정보통신진흥협회장상(2017)
ㆍ 2016 날씨 빅데이터 콘테스트/ 기상산업 진흥원장상(2016)
ㆍ 제4회 빅콘테스트 보험사기 예측 알고리즘 개발 / 본선진출(2016)
ㆍ 제3회 빅콘테스트 야구 경기 예측 알고리즘 개발 / 미래창조과학부 장관상(2015)
* blog : https://bluediary8.tistory.com
주로 연구하는 분야는 데이터 사이언스, 강화학습, 딥러닝 입니다.
크롤링과 텍스트마이닝은 현재는 취미로 하고있습니다 :)
크롤링을 이용해서 인기있는 커뮤니티 글만 수집해서 보여주는 마롱이라는 앱을 개발하였고
전국의 맛집리스트와 블로그를 수집해서 맛집 추천 앱도 만들었었죠 :) (시원하게 말아먹..)
지금은 인공지능을 연구하는 박사과정생입니다.
Tất cả
71 bài giảng ∙ (14giờ 31phút)
Tài liệu khóa học:
Tất cả
29 đánh giá
4.8
29 đánh giá
Đánh giá 3
∙
Đánh giá trung bình 4.7
Đánh giá 5
∙
Đánh giá trung bình 5.0
Đánh giá 5
∙
Đánh giá trung bình 5.0
Đánh giá 6
∙
Đánh giá trung bình 4.5
Đánh giá 1
∙
Đánh giá trung bình 5.0
1.790.933 ₫
Hãy khám phá các khóa học khác của giảng viên!
Khám phá các khóa học khác trong cùng lĩnh vực!