
Thu thập dữ liệu web với R - Giới thiệu
coco
Xây dựng các kỹ năng lập trình R cơ bản và tìm hiểu các kỹ thuật thu thập thông tin cơ bản. Chúng tôi sẽ giải thích từng dòng mã khi bạn tự viết.
입문
R, Web Crawling
형태소분석 하는 방법
Top keyword추출
Wordcloud 이쁘게 그리는 법
감성분석
Topic Modeling(LDA)
쏟아지는 데이터의 바다에서
보석 같은 정보를 만들어봐요! 💎
텍스트 마이닝(Text Mining)은 비정형 데이터에 대한 마이닝 과정입니다. 마이닝은 통계적으로 유의미한 개념을 추출하고, 이들 사이의 패턴을 통해 정보를 끌어내는 과정이예요. 이중 텍스트 마이닝은 동영상이나 메시지, 위치 정보 등 비정형 데이터를 이용한 마이닝을 말합니다. 하지만 비정형 데이터는 정해진 형태가 없기 때문에 데이터 수집이 어려워요.
이번 강의에선 SNS의 활성화로 인해 중요성이 높아지고 있는 비정형 데이터를 다루는 방법을 배울 수 있어요!
형태소 분석기 KoNLP에 대해서 알아보고 Topkeyword를 추출해보고 wordcloud를 그려봅니다
사전을 직접 구축해서 감성 분석하는 방법과 회귀분석(머신러닝)을 통해 감성 분석하는 것에 대해 알아봅니다.
감성 분석(Sentiment Analysis)는 텍스트에 녹아있는 감정이나 의견 같은 주관적인 정보를 단어나 문맥을 바탕으로 수치화하여 분석하는 절차입니다. 감정 분석은 상품이나 서비스에 대한 소비자들의 의견을 듣고, 이를 활용하는 등 비즈니스에서도 활발히 이용되고 있습니다. 감성 분석 역시 텍스트 마이닝 기술의 일종입니다.
Q. 비전공자도 들을 수 있나요?
R언어에 대해 기초적인 지식이 있다는 전제 하에 강의를 진행합니다. R로하는 웹크롤링 입문편을 수강하신 분들은 문제 없이 들으실 수 있습니다.
학습 대상은
누구일까요?
R로 텍스트마이닝 하고 싶으신분
크롤링 강의를 수강하신 분
8,274
명
수강생
500
개
수강평
136
개
답변
4.4
점
강의 평점
20
개
강의
학부에서는 통계학을 전공하고 산업공학(인공지능) 박사를 받고 여전히 공부중인 백수입니다.
수상
ㆍ 제6회 빅콘테스트 게임유저이탈 알고리즘 개발 / 엔씨소프트상(2018)
ㆍ 제5회 빅콘테스트 대출 연체자 예측 알고리즘개발 / 한국정보통신진흥협회장상(2017)
ㆍ 2016 날씨 빅데이터 콘테스트/ 기상산업 진흥원장상(2016)
ㆍ 제4회 빅콘테스트 보험사기 예측 알고리즘 개발 / 본선진출(2016)
ㆍ 제3회 빅콘테스트 야구 경기 예측 알고리즘 개발 / 미래창조과학부 장관상(2015)
* blog : https://bluediary8.tistory.com
주로 연구하는 분야는 데이터 사이언스, 강화학습, 딥러닝 입니다.
크롤링과 텍스트마이닝은 현재는 취미로 하고있습니다 :)
크롤링을 이용해서 인기있는 커뮤니티 글만 수집해서 보여주는 마롱이라는 앱을 개발하였고
전국의 맛집리스트와 블로그를 수집해서 맛집 추천 앱도 만들었었죠 :) (시원하게 말아먹..)
지금은 인공지능을 연구하는 박사과정생입니다.
전체
13개 ∙ (4시간 10분)
해당 강의에서 제공:
전체
11개
4.3
11개의 수강평
수강평 3
∙
평균 평점 5.0
5
Thực ra, thật tuyệt khi được luyện tập cùng nhau. Khi tôi vẫn còn thiếu kinh nghiệm, thật khó để làm theo. Tuy nhiên, tôi nghĩ sẽ rất tốt nếu xem đi xem lại. Tôi nghĩ đó là một bài giảng quan trọng vì không có nhiều nơi bạn có thể nghe phân tích văn bản tiếng Hàn, đặc biệt là phân tích chủ đề và tình cảm, trực tuyến. Tôi nghĩ nếu bạn xem lại một lần nữa, bạn sẽ hiểu rõ hơn một chút và có thể tự mình sử dụng mã. Thật tuyệt khi họ đã cung cấp trước cho tôi tất cả mã.
수강평 12
∙
평균 평점 5.0
5
Là một người nghiên cứu R machine learning và áp dụng nó vào công việc, Hiểu các khái niệm máy học tổng thể, không chỉ khai thác văn bản, Và nó thực sự hữu ích trong việc cải thiện kỹ năng viết mã R. Có thể đạt được cả ứng dụng thực tế và cải thiện kỹ năng cùng một lúc Có thể nói đây là khóa học tiết kiệm chi phí tốt nhất. Bài giảng cuối cùng, LDA, hơi khó, nhưng... Nếu có nhu cầu phân tích tương tự trong tương lai Tôi nghĩ tôi có thể áp dụng nó trong khi xem lại bài giảng~~ Để cung cấp các bài giảng chất lượng cao với giá cả rất phải chăng. Cảm ơn người hướng dẫn rất nhiều... Hẹn gặp lại bạn ở bài giảng tiếp theo.
수강평 4
∙
평균 평점 5.0
수강평 10
∙
평균 평점 5.0
5
Tôi đã đăng ký và đang tham gia bốn bài giảng của người hướng dẫn. Nó rất hữu ích trong việc hiểu việc khai thác văn bản và phân tích tình cảm với R. Tuy nhiên, điều đáng tiếc là việc sao chép mã trong khi tự viết mã và quay đi quay lại trên màn hình thực thi sẽ gây mất tập trung. Sẽ rất tốt nếu người hướng dẫn có thể giải thích sau khi chỉnh sửa. ^^
수강평 3
∙
평균 평점 5.0
5
Đây là một bài giảng rất hay!! Tôi muốn nghe lại bài giảng của Coco haha. Tôi chắc chắn cũng muốn nghe bài giảng tiếp theo.
Cảm ơn bạn luôn luôn cho những đánh giá tốt. Tôi hy vọng nó có ích :)
월 ₩185,063
5개월 할부 시
₩44,000