Thumbnail
데이터 사이언스 데이터 분석
R로 무작정 해보는 data science
55명이 수강하고 있어요.
71,500원

월 14,300원

5개월 할부 시
지식공유자 : 코코
총 32개 수업˙총 7시간 23분
평생 무제한 수강
수료증 발급 강의
입문 초급 중급이상 대상
내 목록 추가 86 공유
중급자를 위해 준비한
[데이터 분석, 데이터베이스] 강의입니다.

R을 통해 무작정 datascience를 해보는 강의 입니다. 데이터를 불러오는 것부터 모델 구축 및 모델 성능 전략까지 한줄한줄 쳐보면서 배웁니다.

✍️
이런 걸
배워요!
R로 머신러닝 모델 적합 시키는 법
머신러닝 모델 성능 늘리는 법

🙆🏻‍♀ R을 통해 무작정 datascience를 해보는 강의입니다.
데이터를 불러오는 것부터 모델 구축 및 모델 성능 전략까지 한줄한줄 쳐보면서 배웁니다..🙆🏻‍♂

"99.9% livecoding, 한 줄 한 줄 따라쳐보면서 배우는 DataScience"

✅ 주의사항

이 강의는 이론보다 실습에 초점이 맞춰져 있는 강의입니다.
R에 대한 기본적인 지식과 머신러닝에 대한 전반적인 지식이 있으셔야 합니다.

🗒 강의소개

R도 배웠고, 머신러닝도 배웠는데  데이터 분석을 할 줄 모르시나요? 
이 강의는 데이터 입력부터 머신러닝 모델 구축 및 모델 성능 향상 전략까지 직접 한 줄 한 줄 코드를 쳐보면서 배우는 강의입니다. 

🌈 머신러닝 모델 무작정 적합해보기

  • R의 기본 데이터로 Linear regression과 Decision tree를 적합해봅니다.
  • 회귀모델을 해석하고 학습 검증 데이터를 나누는 방법에 대해 이야기합니다.

🌈 심장 질병 예측 모델 구축해보기(Linear regression)

  • 로지스틱 회귀분석을 통해 심장 질병 예측 모델을 구축해봅니다. 
  • 변수선택법에 대해 배우고 stepwise/forawrd/backward regression을 각각 적합해봅니다.

🌈 영화 리뷰 감성분석으로 해보는 머신러닝

  • 영화 리뷰 데이터 수집부터 감성모델 구축까지 모두 해봅니다.
  • 가장 기본적으로 쓰이는 텍스트 전처리 방법인 Dcoument Term Matrix를 통해 모델을 구축해봅니다.
  • Ensemble learning 기법을 적용해 봅니다.
  • Word2vec을 활용하여 review를 vector화 시키고 이를 통해 머신러닝 모델을 적합해봅니다.

🌈 kaggle 데이터 분석으로 배우는 머신러닝

  • Class가 불균형한 데이터를 다루는 방법에 대해 이야기 합니다.
  • RandomOversampling/SMOTE/DBSMOTE 등을 적합해봅니다.
  • 문제에 따라 모델의 성능을 높일 수 있는 방안에 대해 고민해보고 직접 구현해 봅니다.

🙋🏻‍♂️ 궁금해요!

Q. R을 어느 정도 할 줄 알아야 하나요?
A. 기본적으로 데이터를 불러들이고 전처리할 줄 아셔야 합니다. R프로그래밍 기초 강의는 필수로 수강을 하셔야 하며, 중급강의는 선택사항입니다.

Q. 머신러닝과 통계학은 어느 정도 알아야 하나요?
A. 기초적인 통계학(t.test/anova 등, 학부 교양수업 수준)을 알고 계시고, 머신러닝에 대한 이론적인 지식(학부 전공 수업 수준)이 있으셔야 듣기 수월하십니다.

지식공유자가 알려주는
강의 수강 꿀팁!
🎓
이런 분들께
추천드려요!
통계학도 배웠고 머신러닝도 배웠는데 실전경험이 없으신 분
여러 머신러닝 모델을 적합해보고 싶으신 분
📚
선수 지식,
필요한가요?
R에 대한 전반 적인 지식
통계학과 머신러닝 기초

안녕하세요
코코 입니다.
코코의 썸네일

학부에서는 통계학을 전공하고 현재는 산업공학(인공지능)을 공부하고 있는 박사과정생입니다.

수상

ㆍ 제6회 빅콘테스트 게임유저이탈 알고리즘 개발 / 엔씨소프트상(2018)

ㆍ 제5회 빅콘테스트 대출 연체자 예측 알고리즘개발 / 한국정보통신진흥협회장상(2017)

ㆍ 2016 날씨 빅데이터 콘테스트/ 기상산업 진흥원장상(2016) 

ㆍ 제4회 빅콘테스트 보험사기 예측 알고리즘 개발 / 본선진출(2016)

ㆍ 제3회 빅콘테스트 야구 경기 예측 알고리즘 개발 / 미래창조과학부 장관상(2015)

* blog : https://bluediary8.tistory.com

주로 연구하는 분야는 데이터 사이언스, 강화학습, 딥러닝 입니다.

크롤링과 텍스트마이닝은 현재는 취미로 하고있습니다 :) 

크롤링을 이용해서 인기있는 커뮤니티 글만 수집해서 보여주는 마롱이라는 앱을 개발하였고

전국의 맛집리스트와 블로그를 수집해서 맛집 추천 앱도 만들었었죠 :) (시원하게 말아먹..)

지금은 인공지능을 연구하는 박사과정생입니다.

 

커리큘럼 총 32개 ˙ 7시간 23분의 수업
이 강의는 영상, 첨부 파일이 제공됩니다. 미리보기를 통해 콘텐츠를 확인해보세요.
섹션 0. 오리엔테이션
오리엔테이션 04:16
섹션 1. 무작정 머신러닝 돌려보기
Linear regression 적합해보기 미리보기 11:00
Linear regression모델 해석하기 25:34
학습데이터/검증데이터 분할하고 모델 적합하기 16:57
섹션 2. 무작정 머신러닝 돌려보기2
Tree모델 적합해보기 07:02
Ensemble의 개념에 대한 이해 11:54
RandomForest적합해보기 11:01
섹션 3. Linear regression으로 몸풀기
심장질병여부 예측 모델 구축하기
변수선택법 - Stepwise적용 18:50
섹션 4. 영화리뷰 감성분석으로 해보는 머신러닝
영화리뷰크롤링 12:35
영화리뷰 전처리 11:10
[참고영상] 감성분석의 종류 (사전기반/머신러닝기반) [R로 하는 텍스트마이닝 강의] 20:12
영화리뷰 감성분석 모델 구축하기(Lasso/Ridge) 미리보기 18:27
영화리뷰 감성분석 모델 구축하기(Lasso/Ridge - ensemble) 22:10
영화리뷰 감성분석 모델 구축하기(RandomForest) 15:53
[참고영상] word2vec 개념 [텍스트마이닝 실전 프로젝트 - 뉴스 데이터 분석하기 강의] 10:16
영화리뷰 vector화 하기 (review2vec) 11:01
vector를 통한 머신러닝 모델 학습 11:39
vector를 통한 머신러닝 모델 학습(boosting의 개념) 13:16
vector를 통한 머신러닝 모델 학습(xgboost) 11:40
vector를 통한 머신러닝 모델 학습(xgboost-ensemble) 13:27
섹션 5. Kaggle Data로 하는 data science
xgboost 모델 적합 16:44
Classimbalanced problem - ROS적용 17:06
SMOTE적용 27:57
DBSMOTE적용 12:52
SMOTE-Ensemble적용 05:28
Feature Selection적용 35:13
SMOTE-응용 20:16
Highconfidence Data 19:49
review 09:46
섹션 6. 수업자료
수업자료
영화데이터
강의 게시일 : 2020년 01월 19일 (마지막 업데이트일 : 2020년 01월 22일)
수강평
수강생분들이 직접 작성하신 수강평입니다. 수강평을 작성 시 300잎이 적립됩니다.
아직 평가를 충분히 받지 못한 강의 입니다.
모두에게 도움이 되는 수강평의 주인공이 되어주세요!😄️️
71,500원

월 14,300원

5개월 할부 시
내 목록 추가 86 공유
지식공유자 : 코코
총 32개 수업˙총 7시간 23분
평생 무제한 수강
수료증 발급 강의
입문 초급 중급이상 대상
지식공유자 되기
많은 사람들에게 배움의 기회를 주고,
경제적 보상을 받아보세요.
지식공유참여
기업 교육을 위한 인프런
“인프런 비즈니스” 를 통해 모든 팀원이 인프런의 강의를
자유롭게 학습하는 환경을 제공하세요.
인프런 비즈니스