R로 무작정 해보는 data science
R로 무작정 해보는 data science
수강정보
(2개의 수강평)
35명의 수강생
25% 할인, D-3
53,620원
71,500원
지식공유자 : 코코
32회 수업 · 총 7시간 23분 수업
기간 : 평생 무제한 시청
수료증 : 발급 강의
수강 난이도 : 중급이상

이 강의는

R을 통해 무작정 datascience를 해보는 강의 입니다. 데이터를 불러오는 것부터 모델 구축 및 모델 성능 전략까지 한줄한줄 쳐보면서 배웁니다.

이런 걸 배워요

  • R로 머신러닝 모델 적합 시키는 법
  • 머신러닝 모델 성능 늘리는 법

🙆🏻‍♀ R을 통해 무작정 datascience를 해보는 강의입니다.
데이터를 불러오는 것부터 모델 구축 및 모델 성능 전략까지 한줄한줄 쳐보면서 배웁니다..🙆🏻‍♂

"99.9% livecoding, 한 줄 한 줄 따라쳐보면서 배우는 DataScience"

✅ 주의사항

이 강의는 이론보다 실습에 초점이 맞춰져 있는 강의입니다.
R에 대한 기본적인 지식과 머신러닝에 대한 전반적인 지식이 있으셔야 합니다.

🗒 강의소개

R도 배웠고, 머신러닝도 배웠는데  데이터 분석을 할 줄 모르시나요? 
이 강의는 데이터 입력부터 머신러닝 모델 구축 및 모델 성능 향상 전략까지 직접 한 줄 한 줄 코드를 쳐보면서 배우는 강의입니다. 

🌈 머신러닝 모델 무작정 적합해보기

  • R의 기본 데이터로 Linear regression과 Decision tree를 적합해봅니다.
  • 회귀모델을 해석하고 학습 검증 데이터를 나누는 방법에 대해 이야기합니다.

🌈 심장 질병 예측 모델 구축해보기(Linear regression)

  • 로지스틱 회귀분석을 통해 심장 질병 예측 모델을 구축해봅니다. 
  • 변수선택법에 대해 배우고 stepwise/forawrd/backward regression을 각각 적합해봅니다.

🌈 영화 리뷰 감성분석으로 해보는 머신러닝

  • 영화 리뷰 데이터 수집부터 감성모델 구축까지 모두 해봅니다.
  • 가장 기본적으로 쓰이는 텍스트 전처리 방법인 Dcoument Term Matrix를 통해 모델을 구축해봅니다.
  • Ensemble learning 기법을 적용해 봅니다.
  • Word2vec을 활용하여 review를 vector화 시키고 이를 통해 머신러닝 모델을 적합해봅니다.

🌈 kaggle 데이터 분석으로 배우는 머신러닝

  • Class가 불균형한 데이터를 다루는 방법에 대해 이야기 합니다.
  • RandomOversampling/SMOTE/DBSMOTE 등을 적합해봅니다.
  • 문제에 따라 모델의 성능을 높일 수 있는 방안에 대해 고민해보고 직접 구현해 봅니다.

🙋🏻‍♂️ 궁금해요!

Q. R을 어느 정도 할 줄 알아야 하나요?
A. 기본적으로 데이터를 불러들이고 전처리할 줄 아셔야 합니다. R프로그래밍 기초 강의는 필수로 수강을 하셔야 하며, 중급강의는 선택사항입니다.

Q. 머신러닝과 통계학은 어느 정도 알아야 하나요?
A. 기초적인 통계학(t.test/anova 등, 학부 교양수업 수준)을 알고 계시고, 머신러닝에 대한 이론적인 지식(학부 전공 수업 수준)이 있으셔야 듣기 수월하십니다.

도움 되는 분들

  • 통계학도 배웠고 머신러닝도 배웠는데 실전경험이 없으신 분
  • 여러 머신러닝 모델을 적합해보고 싶으신 분

선수 지식

  • R에 대한 전반 적인 지식
  • 통계학과 머신러닝 기초

지식공유자 소개

학부에서는 통계학을 전공하고 현재는 산업공학(인공지능)을 공부하고 있는 박사과정생입니다.

수상

ㆍ 제6회 빅콘테스트 게임유저이탈 알고리즘 개발 / 엔씨소프트상(2018)

ㆍ 제5회 빅콘테스트 대출 연체자 예측 알고리즘개발 / 한국정보통신진흥협회장상(2017)

ㆍ 2016 날씨 빅데이터 콘테스트/ 기상산업 진흥원장상(2016) 

ㆍ 제4회 빅콘테스트 보험사기 예측 알고리즘 개발 / 본선진출(2016)

ㆍ 제3회 빅콘테스트 야구 경기 예측 알고리즘 개발 / 미래창조과학부 장관상(2015)

* blog : https://bluediary8.tistory.com

주로 연구하는 분야는 데이터 사이언스, 강화학습, 딥러닝 입니다.

크롤링과 텍스트마이닝은 현재는 취미로 하고있습니다 :) 

크롤링을 이용해서 인기있는 커뮤니티 글만 수집해서 보여주는 마롱이라는 앱을 개발하였고

전국의 맛집리스트와 블로그를 수집해서 맛집 추천 앱도 만들었었죠 :) (시원하게 말아먹..)

지금은 인공지능을 연구하는 박사과정생입니다.

 

교육과정

모두 펼치기 32 강의 7시간 23분
섹션 0. 오리엔테이션
1 강의 04 : 16
오리엔테이션
04 : 16
섹션 1. 무작정 머신러닝 돌려보기
3 강의 53 : 31
Linear regression 적합해보기
11 : 00
Linear regression모델 해석하기
25 : 34
학습데이터/검증데이터 분할하고 모델 적합하기
16 : 57
섹션 2. 무작정 머신러닝 돌려보기2
3 강의 29 : 57
Tree모델 적합해보기
07 : 02
Ensemble의 개념에 대한 이해
11 : 54
RandomForest적합해보기
11 : 01
섹션 3. Linear regression으로 몸풀기
2 강의 18 : 50
심장질병여부 예측 모델 구축하기
변수선택법 - Stepwise적용
18 : 50
섹션 4. 영화리뷰 감성분석으로 해보는 머신러닝
12 강의 171 : 46
영화리뷰크롤링
12 : 35
영화리뷰 전처리
11 : 10
[참고영상] 감성분석의 종류 (사전기반/머신러닝기반) [R로 하는 텍스트마이닝 강의]
20 : 12
영화리뷰 감성분석 모델 구축하기(Lasso/Ridge)
18 : 27
영화리뷰 감성분석 모델 구축하기(Lasso/Ridge - ensemble)
22 : 10
영화리뷰 감성분석 모델 구축하기(RandomForest)
15 : 53
[참고영상] word2vec 개념 [텍스트마이닝 실전 프로젝트 - 뉴스 데이터 분석하기 강의]
10 : 16
영화리뷰 vector화 하기 (review2vec)
11 : 01
vector를 통한 머신러닝 모델 학습
11 : 39
vector를 통한 머신러닝 모델 학습(boosting의 개념)
13 : 16
vector를 통한 머신러닝 모델 학습(xgboost)
11 : 40
vector를 통한 머신러닝 모델 학습(xgboost-ensemble)
13 : 27
섹션 5. Kaggle Data로 하는 data science
9 강의 165 : 11
xgboost 모델 적합
16 : 44
Classimbalanced problem - ROS적용
17 : 06
SMOTE적용
27 : 57
DBSMOTE적용
12 : 52
SMOTE-Ensemble적용
05 : 28
Feature Selection적용
35 : 13
SMOTE-응용
20 : 16
Highconfidence Data
19 : 49
review
09 : 46
섹션 6. 수업자료
2 강의
수업자료
영화데이터

공개 일자

2020년 1월 19일 (마지막 업데이트 일자 : 2020년 1월 22일)

수강 후기

아직 평가를 충분히 받지 못한 강의 입니다.
모두에게 도움이 되는 수강평의 주인공이 되어주세요!😄️️

default_profile.png
Dongyoub Kim 5달 전
R의 기본적인 지식은 있어야 합니다. 따로 학습하는 시간이 제공되지 않기 때문에 진행하는 내역을 따라가고 이해하려면 R 문법 사용과 머신러닝 알고리즘 사용법에 대한 경험이 있어야 수월하게 이해할 수 있습니다.
default_profile.png
이기혁 4달 전
머신러닝과 R에 대한 기본 개념을 어느정도 알아야 들을 수 있는 강의 입니다
지식공유자 되기
많은 사람들에게 배움의 기회를 주고,
경제적 보상을 받아보세요.
지식공유참여
기업 교육을 위한 인프런
“인프런 비즈니스” 를 통해 모든 팀원이 인프런의 강의들을
자유롭게 학습하는 환경을 제공하세요.
인프런 비즈니스