
R로 하는 웹 크롤링 - 입문편
코코
기초적인 R프로그래밍 실력을 쌓고 기본적인 크롤링 기법을 익힙니다 코드를 직접 작성하면서 한줄한줄 설명해 드립니다
입문
R, 웹 크롤링
Đây là bài giảng trong đó bạn sẽ tìm hiểu các từ khóa/wordcloud/phân tích tình cảm/mô hình chủ đề hàng đầu của văn bản thông qua R.
Cách thực hiện phân tích hình thái
Trích xuất từ khóa hàng đầu
Cách vẽ wordcloud đẹp
Phân tích tình cảm
Mô hình hóa chủ đề (LDA)
Trong biển dữ liệu đang đổ về
Hãy cùng tạo ra một số thông tin giống như viên ngọc quý! 💎
Khai thác văn bản là một quá trình khai thác dữ liệu phi cấu trúc. Khai thác bao gồm việc trích xuất các khái niệm có ý nghĩa thống kê và trích xuất thông tin thông qua các mẫu hình bên trong chúng. Khai thác văn bản đề cập đến việc khai thác dữ liệu phi cấu trúc như video, tin nhắn và thông tin vị trí . Tuy nhiên, dữ liệu phi cấu trúc thiếu định dạng xác định, khiến việc thu thập dữ liệu trở nên khó khăn.
Trong bài giảng này, bạn sẽ học cách xử lý dữ liệu phi cấu trúc, một vấn đề ngày càng trở nên quan trọng do sự phát triển của mạng xã hội!
Tìm hiểu về KoNLP, một công cụ phân tích hình thái, trích xuất các từ khóa hàng đầu và tạo đám mây từ.
Tìm hiểu cách xây dựng từ điển của riêng bạn để thực hiện phân tích tình cảm và cách thực hiện bằng cách sử dụng phân tích hồi quy (học máy).
Phân tích cảm xúc là một quá trình định lượng thông tin chủ quan, chẳng hạn như cảm xúc hoặc ý kiến, chứa trong văn bản, dựa trên từ ngữ và ngữ cảnh . Phân tích cảm xúc cũng được sử dụng tích cực trong kinh doanh, chẳng hạn như thu thập và khai thác ý kiến của người tiêu dùng về sản phẩm và dịch vụ. Phân tích cảm xúc cũng là một loại công nghệ khai thác văn bản.
H. Sinh viên không chuyên ngành cũng có thể tham gia khóa học này không?
Khóa học này yêu cầu bạn phải có hiểu biết cơ bản về ngôn ngữ R. Những ai đã học khóa "Giới thiệu về Thu thập dữ liệu Web với R" sẽ thấy khóa học này rất dễ hiểu.
Khóa học này dành cho ai?
Bất kỳ ai muốn khai thác văn bản bằng R
Những người đã tham gia khóa học bò
8,274
Học viên
500
Đánh giá
136
Trả lời
4.4
Xếp hạng
20
Các khóa học
학부에서는 통계학을 전공하고 산업공학(인공지능) 박사를 받고 여전히 공부중인 백수입니다.
수상
ㆍ 제6회 빅콘테스트 게임유저이탈 알고리즘 개발 / 엔씨소프트상(2018)
ㆍ 제5회 빅콘테스트 대출 연체자 예측 알고리즘개발 / 한국정보통신진흥협회장상(2017)
ㆍ 2016 날씨 빅데이터 콘테스트/ 기상산업 진흥원장상(2016)
ㆍ 제4회 빅콘테스트 보험사기 예측 알고리즘 개발 / 본선진출(2016)
ㆍ 제3회 빅콘테스트 야구 경기 예측 알고리즘 개발 / 미래창조과학부 장관상(2015)
* blog : https://bluediary8.tistory.com
주로 연구하는 분야는 데이터 사이언스, 강화학습, 딥러닝 입니다.
크롤링과 텍스트마이닝은 현재는 취미로 하고있습니다 :)
크롤링을 이용해서 인기있는 커뮤니티 글만 수집해서 보여주는 마롱이라는 앱을 개발하였고
전국의 맛집리스트와 블로그를 수집해서 맛집 추천 앱도 만들었었죠 :) (시원하게 말아먹..)
지금은 인공지능을 연구하는 박사과정생입니다.
Tất cả
13 bài giảng ∙ (4giờ 10phút)
Tài liệu khóa học:
Tất cả
11 đánh giá
4.3
11 đánh giá
Đánh giá 3
∙
Đánh giá trung bình 5.0
Đánh giá 12
∙
Đánh giá trung bình 5.0
5
R 기계학습을 study 하고 업무에 적용하고 있는 사람으로서 단지 텍스타마이닝 뿐 아니라 전반적인 기계학습 개념 이해, 그리고 R 코딩 스킬 향상에도 정말 도움 많이 되는, 실무적용성과 실력향상 두 가지를 동시에 잡을 수 있는 가성비 최고의 강의라 할 수 있겠습니다. 맨 마지막 강의인 LDA 내용도 조금 어렵긴 했지만.. 나중에 유사한 분석 필요 상황이 있다면 강의 다시 돌려 보면서 적용 가능할 듯 하네요~~ 수준높은 강의를 아주 저렴한 가격에 제공해 주신 강사님께 큰 감사드리며... 다음 강의 때 또 뵙겠습니다 ㅎㅎ
Đánh giá 4
∙
Đánh giá trung bình 5.0
Đánh giá 10
∙
Đánh giá trung bình 5.0
925.315 ₫
Hãy khám phá các khóa học khác của giảng viên!
Khám phá các khóa học khác trong cùng lĩnh vực!