Thumbnail
인공지능 딥러닝 · 머신러닝

머신러닝 기초부터 탄탄히 정복하기 대시보드

(4.8)
16개의 수강평 ∙  195명의 수강생
85,800원

월 17,160원

5개월 할부 시
지식공유자: 코코
총 71개 수업 (14시간 31분)
수강기한: 
무제한
수료증: 발급
난이도: 
입문
-
초급
-
중급이상
지식공유자 답변이 제공되는 강의입니다
폴더에 추가 공유

초급자를 위해 준비한
[딥러닝 · 머신러닝] 강의입니다.

이론과 실전은 다릅니다. 머신러닝의 기본 개념을 파악하고, 꼭 알아야 할 여러 모델들의 핵심 개념과 이론을 소개합니다. 그리고, 다양한 데이터를 다루어 보면서 실전에 도움되는 여러 기법들과 노하우를 공유합니다.

✍️
이런 걸
배워요!
머신러닝과 인공지능에 대한 기본 개념
선형 회귀 분석
알아야할 머신 러닝 모델들의 핵심 개념
클래스 불균형 문제를 해결 하는 기법들
군집 분석에 대한 개념과 이론
데이터를 제대로 분석하는 방법

초보 데이터 사이언티스트를 위한 첫 걸음!

데이터 사이언티스트가 
되기 위한 핵심 지식 총집합 👨‍💻

머신러닝 및 인공지능에 대한 기본 핵심 개념을 학습하고 싶으신가요? 이 강의에서는 데이터 사이언티스트가 되기 위해 꼭 필요한 핵심 개념과 이론, 그리고 실전에 필요한 여러 가지 기법을 소개합니다.

이론과 실전은 다릅니다. 이론으로 배우는 내용이 실전에서는 먹히지 않는 경우가 많습니다. 

그래서 이 강의에서는 수학적인 설명보다는 핵심 위주의 개념 설명으로 초보자 분들도 쉽게 이해할 수 있도록 하였습니다. 뿐만 아니라, 실전에서 데이터를 다룰 때 마주치는 문제점들과 그 문제점들을 해결하기 위한 여러 방법들과 노하우들도 함께 공유합니다.


누가 들으면 좋을까요? 🔍

머신러닝 모델들의 
핵심 개념과 이론을 
알고 싶으신 분 

데이터 사이언티스트로 
빠르게 성장하고 
싶으신 분 

실전에서 필요한 
머신러닝 기법과 노하우를 
익히고 싶으신 분 

내용을 모두 학습하고 나면 최소한 데이터 사이언티스트로서 데이터를 제대로 분석할 수 있게끔 강의를 구성하였습니다. 뿐만 아니라, 데이터 도메인에 맞는 적절한 실험 설계를 하고 모델 성능을 높이기 위한 변수 선택 및 모델링까지 하실 수 있게 될 것입니다.

강의 관련 예상 Q&A를 확인해보세요 🙋‍♀️

Q. 강의를 듣기 위해 수학적 지식이 많이 필요한가요?

학부 수준의 통계학을 필요로 하지만, 관련 지식이 없으셔도 무방합니다. 

Q. R을 다룰 줄 알아야 하나요?

네, R 또는 Python을 어느 정도 할 줄 안다는 전제하에 수업을 진행합니다. 아래 <R프로그래밍 기초 다지기> 수업을 들으시길 권장드립니다.

R프로그래밍 기초 다지기
데이터 분석, R프로그래밍이 처음이라면?무료 강의


이 강의만의 
핵심 장점 3가지! ✨

경험에서 나온 
핵심 노하우 
전달 

생생하게 
배우는 
라이브 코딩 

다양한 
데이터로 
실전 감각 Up 

1️⃣ 경험에서 우러나온 핵심 노하우 전달!

단순히 머신러닝 이론들을 강의하고 데이터에 적합을 시켜보는 단순한 실습에서 그치지 않습니다. 7회 참여한 빅데이터 대회(7회 본선 진출, 5회 수상)와 다양한 프로젝트를 통해 얻은 경험으로부터 데이터 분석을 잘하기 위한 노하우를 최대로 전달해드리고자 합니다.

2️⃣ 생생하게 배우는 라이브 코딩 중심의 학습.

실제로 제가 데이터 분석을 하는 과정을 보여드리기 위해 대부분은 실습은 라이브 코딩으로 진행됩니다. 코딩하는 과정 중에 모르는 게 생겼을 때 어떻게 검색을 하고 어떻게 적용을 하는 것까지 세세하게 보여드리고, 데이터를 다루면서 겪는 문제점과 이를 해결하기 위해 사용하는 방법들도 함께 공유합니다.

3️⃣ 다양한 데이터로 실전 감각 Upgrade!

다양한 데이터를 다루어봅니다. 예제로 많이 사용되는 Boston House 집값 예측 데이터를 포함하여, 다중공선성이 매우 강한 시뮬레이션 데이터, 영화 리뷰 긍/부정 예측(한국어) 데이터, 서울의 빌라 전세값 예측 데이터, Kaggle의 otto 데이터 등 다양한 데이터를 다루어 실전 감각을 익히도록 합니다.


강의 주요 내용을 
확인해보세요 📚

🌈 머신러닝과 딥러닝의 기본 개념

머신러닝이란 무엇이고, 머신러닝으로 무엇을 할 수 있는지에 대해 다루어 봅니다. 또한, 머신러닝과 딥러닝의 차이점이 무엇이고, 다양한 머신러닝 모델들과 딥러닝 모델들에 대해 간략하게 소개합니다. 더불어 머신러닝과 딥러닝 분야에서 공통적으로 발생하는 과적합 현상에 대해 다루어봅니다. 

🌈 (통계학에서 바라보는) 선형 회귀 모델

머신러닝을 배울 때 항상 처음 배우는 모델이 선형 회귀 모델입니다. 그만큼 쉽고 간단한 모델이지만, 성능이 좋지 않다는 많이 쓰이지 않는 경향이 있습니다. 하지만 선형 회귀 모델은 현업에서 많이 사용되고, 선형 회귀 문제에서는 강력한 도구입니다. 가장 기본이되는 이론과 개념을 집중적으로 다루어 봅니다.

🌈 필수적으로 알아야 할 여러 머신러닝 모델들
(Decision Tree, kNN, Ensemble Learning, Clustering, Shap Value)

필수적으로 알아야 할 머신러닝 모델들에 대해 다루어봅니다. 수학적인 내용보다는 이해하기 쉽도록 개념 위주로 강의를 진행합니다. 많이 쓰이지는 않는 모델인 Decision Tree, kNN등과 같은 모델들은 단일 모델로서는 잘 쓰이지는 않지만 다른 분야 또는 모델에서 다양하게 활용됩니다. 그러므로 등한시 해서는 절대 안 됩니다. 다양한 모델들의 개념들과 활용법을 익히고, eXplainable AI로 각광받고 있는 ShapValue에 대해서도 소개합니다.

🌈 Class imbalanced problem과 해결 방법들

클래스 불균형 문제는 생각보다 다양한 분야에서 빈번하게 발생하고, 다양한 문제를 야기시킵니다. 대표적으로 다수의 클래스 편향적으로 모델이 학습하여 예측 성능이 저하된다는 점을 들 수 있습니다. 이러한 문제점을 해결하기 위한 다양한 기법(Resampling method)들에 대해 소개합니다.

🌈 데이터 사이언티스트로서 실험을 설계하는 방법

데이터를 분석하는 것은 단순히 데이터를 읽고 모델을 적합하는 과정으로 끝나지 않습니다. 기본적은 데이터 전처리를 거치고 Y값을 예측하기 위해 주요 파생 변수를 생성시키고, 적절한 실험 설계를 필수적으로 진행해야 합니다. 다양한 상황에 맞는 실험 설계와 데이터 사이언티스트로서 알아야 할 필수적인 지식을 전달해 드립니다.

코코님으로부터 온 편지 💌

"머신러닝의 이론과 실전에는 상당한 차이가 존재합니다. 세상에는 다양한 도메인과 데이터가 있고, 데이터를 분석하기 위해서는 단순히 모델을 학습시키는 것에서 그쳐서는 안됩니다. 도메인에 맞는 적절한 실험 설계와 모델의 성능을 높이기 위한 파생변수 생성과 분석 목적에 따른 모델 선택이 필수적으로 뒷받침 되어야 합니다.

이 강의에서는 데이터 사이언스와 인공지능의 개념과 핵심을 최대한 쉽게 설명하고, 실전에서 쓸 수 있는 다양한 팁들과 노하우를 제공합니다. 이 강의를 통해 데이터 분석의 실전 감각을 높이도록 실력을 향상시킬 수 있기를 바랍니다."

이런 분들께 추천드려요!

🎓
학습 대상은
누구일까요?
머신러닝 모델들의 핵심 개념과 이론을 알고 싶으신 분
데이터 사이언티스트로서 빠르게 성장하고 싶으신 분
📚
선수 지식,
필요할까요?
학부수준의 통계학
R프로그래밍 기초

안녕하세요
코코 입니다.
코코의 썸네일

학부에서는 통계학을 전공하고 산업공학(인공지능) 박사를 받고 여전히 공부중인 백수입니다.

 

수상

ㆍ 제6회 빅콘테스트 게임유저이탈 알고리즘 개발 / 엔씨소프트상(2018)

ㆍ 제5회 빅콘테스트 대출 연체자 예측 알고리즘개발 / 한국정보통신진흥협회장상(2017)

ㆍ 2016 날씨 빅데이터 콘테스트/ 기상산업 진흥원장상(2016) 

ㆍ 제4회 빅콘테스트 보험사기 예측 알고리즘 개발 / 본선진출(2016)

ㆍ 제3회 빅콘테스트 야구 경기 예측 알고리즘 개발 / 미래창조과학부 장관상(2015)

* blog : https://bluediary8.tistory.com

주로 연구하는 분야는 데이터 사이언스, 강화학습, 딥러닝 입니다.

크롤링과 텍스트마이닝은 현재는 취미로 하고있습니다 :) 

크롤링을 이용해서 인기있는 커뮤니티 글만 수집해서 보여주는 마롱이라는 앱을 개발하였고

전국의 맛집리스트와 블로그를 수집해서 맛집 추천 앱도 만들었었죠 :) (시원하게 말아먹..)

지금은 인공지능을 연구하는 박사과정생입니다.

 

 

 

 

커리큘럼 총 71 개 ˙ 14시간 31분의 수업
이 강의는 영상, 첨부 파일이 제공됩니다. 미리보기를 통해 콘텐츠를 확인해보세요.
섹션 0. 오리엔테이션
섹션 1. 인공지능과 머신러닝의 개념
머신러닝의 개념 미리보기 13:09 머신러닝의 구분 미리보기 06:35 머신러닝의 종류 미리보기 25:17
딥러닝이란? 10:22
딥러닝의 여러 분야 19:04
모형의 적합성 평가 22:25
모형의 성능 지표 15:06
섹션 2. 선형 회귀 분석
회귀분석이란 미리보기 08:15 회귀 계수의 추정 미리보기 13:32
회귀 계수의 의미 15:10
다중 회귀 분석 09:32
모델검정과 다중공선성 11:26
다중공선성 진단 방법 17:36
회귀 모델의 성능 지표 04:57
변수 선택법(Stepwise, Feedforward, Backward) 09:06
교호작용 04:11
회귀 모델의 진단 06:28
다항 회귀 분석 04:15
로지스틱 회귀 분석 08:53
로지스틱 회귀 분석2 (회귀계수에 대한 해석) 04:30
회귀 계수 축소법 08:08
회귀 계수 축소법 - Ridge 09:02
회귀 계수 축소법 (LASSO, ElasticNet) 11:42
FeatureSelection 정리 15:53
섹션 3. 알아야할 Machine Learning 모델
k-Nearest Neighbor (k-NN) 13:31
Decision Tree (DT) 18:46
Principal Component Analysis (PCA) 20:32
섹션 4. Ensemble Learning
Ensemble learning이란 미리보기 09:20 Ensemble learning이란2 미리보기 09:30
Bagging 11:31
RandomForest 08:13
Boosting - Adaboost 11:53
Gradient Boosting 12:58
Gradient Boosting의 종류 (Xgboost, LightGBM, Catboost) 11:48
Stacking이란 10:27
Ensemble의 Ensemble 06:19
앙상블 모델의 중요 변수 추출 방법 08:27
SHAP value란 18:08
DataScience 분야에서 Tree기반 모델이 좋은 성능을 보이는 이유 13:36
섹션 5. 군집 분석(Clustering)
Clustering이란 미리보기 07:54
K-means clustering 09:36
최저의 K를 찾는 방법 12:09
K-medoid clustering 04:30
계층적 군집 분석 (Hierarchical Clustering) 11:49
DBSCAN(Density-based spatial clustering of applications with noise) 12:57
섹션 6. 클래스 불균형 문제(Class Imbalanced Problem)
Class Imbalanced Problem이란 미리보기 13:49
Class Imbalanced Problem을 해결하기 위한 방법들 15:38
Oversampling 기법 12:28
SMOTE의 변형 기법들 07:58
Undersampling 기법 07:41
섹션 7. 데이터 분석 과정
데이터 분석 과정과 상황에 따른 실험 설계 28:41
섹션 8. 실습(회귀 분석하기)
단순 선형 회귀 모델 적합시키기 미리보기 23:14
단순 선형 회귀 모델 적합 및 해석 14:06
다중 선형 회귀 모델 적합시키기 15:04
실험 설계 하기(학습/검증 데이터 분할) 10:17
변수 선택법 (Stepwise) 07:57
회귀 계수 축소법 (Lasso/Ridge) 28:51
다중공선성이 심한 데이터에 대한 접근 11:16
섹션 9. 영화 리뷰 긍/부정 예측 모델 만들기
데이터 전처리 - Document Term Matrix만들기 미리보기 17:23
영화 리뷰 긍/부정 모델 개발 (DT) 12:22
영화 리뷰 긍/부정 모델 개발 (LASSO/Ridge) 16:24
영화 리뷰 긍/부정 모델 개발 (LASSO Ensemble) 12:13
영화 리뷰 긍/부정 모델 개발 (RandomForest) 13:46
영화 리뷰 긍/부정 모델 개발 (Xgboost) 14:17
영화 리뷰 긍/부정 모델 개발 (LightGBM) 08:49
섹션 10. 다양한 데이터 다루어보기
Kaggle otto 데이터 (Multi-Class 모델 - Xgboost/LightGBM) 21:31
서울 빌라 전세 값 예측 모델 만들기 (선형 회귀 모델) 15:31
서울 빌라 전세 값에 영향을 끼치는 변수 찾기(xgboost - SHAP Value) 12:56
섹션 11. 강의자료
강의자료
코드및데이터
강의 게시일 : 2022년 02월 24일 (마지막 업데이트일 : 2022년 03월 02일)
수강평 총 16개
수강생분들이 직접 작성하신 수강평입니다.
4.8
16개의 수강평
5점
4점
3점
2점
1점
VIEW 추천 순 최신 순 높은 평점 순 낮은 평점 순 평점 순 높은 평점 순 낮은 평점 순
jihyun.song thumbnail
5
너무 즐겁게 듣고 있습니다
2024-02-05
정인욱 thumbnail
4
.....
2023-12-28
조성래 thumbnail
5
좋은강의 감사합니다.
2023-12-12
정승욱 thumbnail
5
너무 유익했습니다. 걍의가 어려운만큼 여러번 수강해야할거 같습니다
2023-12-27
최명용 thumbnail
3
잘들었습니다.
2023-12-26