Thumbnail
BEST
인공지능 딥러닝 · 머신러닝

캐글 Advanced 머신러닝 실전 박치기 대시보드

(4.9)
65개의 수강평 ∙  1,339명의 수강생

66,000원

지식공유자: 권 철민
총 70개 수업 (12시간 55분)
수강기한: 
무제한
수료증: 발급
난이도: 
입문
-
초급
-
중급이상
지식공유자 답변이 제공되는 강의입니다
폴더에 추가 공유

중급자를 위해 준비한
[딥러닝 · 머신러닝] 강의입니다.

본 강의는 Kaggle의 Home Credit Default Risk 경연대회 머신 러닝 모델을 구현을 통해, 여러분을 실전적인 머신 러닝 구축 전문가로 한단계 실력을 업그레이드 할 수 있도록 만들어진 강의 입니다.

✍️
이런 걸
배워요!
캐글의 실전 경연 대회 문제를 접하면서 머신러닝 실전 구현 능력을 업그레이드
실무에 머신러닝을 적용할 수 있는 수준으로 구현 능력 업그레이드
머신러닝 모델의 성능 개선 방법
머신러닝을 위한 데이터 분석 능력 향상
머신러닝 Feature Engineering의 구체적인 구현 방법

머신러닝, 실전 구현 능력까지 든든하게!
직접 경연대회 머신러닝 모델을 구현해보세요.

 

강의 소개 🤖

안녕하십니까,

파이썬 머신러닝 완벽 가이드의 저자 권철민 입니다.

실무에서 필요로 하는 진정한 머신러닝 전문가가 되기 위해서는 머신러닝에 대한 이해뿐만 아니라 데이터 처리 능력, 적용 업무의 이해 능력들을 함께 갖추고 있어야 합니다. 하지만 이러한 능력들은 실제적으로 경험해 보지 않거나 계획적으로 훈련되지 않는다면, 많은 시간과 노력을 들여도 얻기 힘든 요소입니다.

 

 

이번에 출시한 "캐글 Advanced 머신러닝 실전 박치기" 강의는 캐글의 "Home Credit Default Risk 경연대회" 머신러닝 문제를 저와 함께 구현해 나가면서 이러한 3가지 요소들을 배양해 나가고, 여러분의 실전 머신러닝 구현 능력과 자신감을 확실하게 업그레이드 할 수 있도록 만들어졌습니다.

 

권 철민, 캐글(Kaggle) 머신러닝

 

'Home Credit Default Risk 경연대회' 문제는 실무 업무에서 활용될 수 있는 유형의 데이터 모델과 여러 개의 데이터 세트들을 가지고 있습니다.

 

 

본 강의는 이 경연대회 문제를 기반으로 데이터 모델과 분석 도메인, 데이터 분석 EDA, Feature Engineering, 하이퍼 파라미터 튜닝, 모델 성능 최적화 등 머신러닝의 중요 영역에 대해서 여러분이 충분히 해당 능력을 배양할 수 있도록 상세하고 자세하게 코드를 구현해 가면서 설명을 드릴 것입니다.

강의에서 사용되는 머신러닝 알고리즘은 많은 캐글러들이 사랑하는 LightGBM 입니다. 여러분은 구현 과제를 통해서 Home Credit Default Risk 경연대회 상위 10%에 해당하는 구현 코드를 작성하게 되며, 이를 통해 성능을 최적화한 모델 구현에 대한 자신감을 얻으실 수 있을 것입니다.

 

 

 

본 강의의 특징 📚

1. 상세하고 쉬운 실습 코드 설명과 Live Coding을 통한 실제 구현 이해도 향상

강의 대부분이 실습 코드를 설명하는 부분으로 되어 있으며, 매우 자세하게 코드들을 Line by Line으로 설명해 드립니다. 특히 중요한 구현 부분의 경우는 저와 함께 Live Coding을 수행할 수 있도록 만들어져서, 여러분의 구현 이해도를 더욱 향상시켜드릴 것입니다.

 

2. 캐글이나 데이콘 등의 경연 대회를 대비한 성능 중심 모델 구현 능력 향상

본 강의를 통해 캐글이나 데이콘 등의 경연대회에서 높은 성적을 올릴 수 있도록 고급 머신러닝 기법, Feature Engineering 및 하이퍼 파라미터 튜닝 기법들을 배우시게 됩니다.
이를 통해 여러분을 머신러닝 경연 대회에 자신감을 가지고 임하실 수 있는 수준으로 올려드릴 것입니다.

 

3. 실무에서 필요로 하는 머신 러닝 전 영역에 대한 자세한 설명

본 강의는 데이터 모델과 분석 도메인, 데이터 분석 EDA, Feature Engineering, 하이퍼 파라미터 튜닝, 모델 성능 최적화 등 머신 러닝 전 영역에 대해서 자세한 설명을 담고 있습니다.
여러분은 이를 통해서 비단 머신러닝뿐만 아니라 데이터 가공과 업무 도메인 이해 능력을 향상시킬 수 있으며, 이를 통해 실무에서 필요로 하는 머신러닝 전문가로서의 기틀을 마련할 수 있을 것입니다.

 

 

강의 선수 지식 🏃‍♂️

 

파이썬 머신러닝 완벽 가이드  인프런 베스트셀러 
화제의 공룡책, 동영상으로 만나보세요!

 

본 강의는 머신러닝에 대한 기반 이해를 미리 갖추고 있는 수강생 분들을 위한 Advanced 머신러닝 프로젝트 강의입니다. '파이썬 머신러닝 완벽 가이드' 책의 1~4장(분류)까지 정도의 내용을 이해하고 있다고 가정하고 만들어졌습니다.

'파이썬 머신러닝 완벽 가이드' 책이나 강의를 접하지 않으셨더라도 '파이썬 머신러닝 완벽 가이드' 목차를 미리 보시고 4장 분류까지의 목차 내용이 낯설지 않다면 수강하실 수 있습니다.

 

 

실습 환경 💻

 Jupyter Notebook   Colab 

12GB 이상 RAM 메모리를 가지는 환경이라면 어디서나 가능합니다. (8GB 정도는 마지막 실습 단계에서 메모리 부족으로 실습이 어려울 수 있습니다). 12GB 이상 RAM이 없는 경우에는 구글 클라우드 $300 무료 크레딧을 이용하여 서버를 생성하거나, 구글 코랩(Colab)을 이용하시면 됩니다. 강의의 첫번째 섹션에서 이들 실습환경을 어떻게 설정하는지 자세히 설명드립니다.

실습 코드는 주피터 노트북 형태로 제공되며 구글 코랩(Colab)용 실습 코드가 별도로 제공됩니다.  실습 코드, 강의 자료는 본 강의 세션 자료실에서 다운로드를 받으실 수 있습니다.

 

인프런이 만난 사람 👨‍💻

권철민님 인터뷰를 읽어보세요 | 보러가기

 

이런 분들께 추천드려요!

🎓
학습 대상은
누구일까요?
캐글이나 데이콘에 본격적으로 도전하시는 분
실무에 머신러닝을 어떻게 적용할지 고민하시는 분
머신러닝 이해를 넘어서 실전적인 모델 구현을 원하시는 분
머신러닝 실력을 한단계 업그레이드 하시려는 분
머신러닝 모델의 성능 개선 방법이 필요하신 분
어려운 문제를 접하면서 실전 머신러닝 능력을 키우시길 원하시는 분
📚
선수 지식,
필요할까요?
파이썬 머신러닝에 대한 이해
파이썬과 Pandas 구현 능력

안녕하세요
권 철민 입니다.
권 철민의 썸네일

(전) 엔코아 컨설팅

(전) 한국 오라클

AI 프리랜서 컨설턴트

파이썬 머신러닝 완벽 가이드 저자

커리큘럼 총 70 개 ˙ 12시간 55분의 수업
이 강의는 영상, 수업 노트, 첨부 파일이 제공됩니다. 미리보기를 통해 콘텐츠를 확인해보세요.
섹션 1. 머신러닝을 위한 데이터 분석 이해
머신러닝 전문가의 지향점 미리보기 04:41 데이터 분석 도메인의 이해 - 01 미리보기 11:32
데이터 분석 도메인의 이해 - 02 07:12
분석을 위한 데이터 처리 기술 기본과 조인(Join) 이해 12:45
Pandas 조인(Join) 실습 07:32
Group by의 이해 15:03
Pandas Group by 실습 12:09
Group by Case When의 이해 08:03
Pandas Group by Case When 실습 06:39
피처 엔지니어링(Feature Engineering)의 이해 11:00
섹션 2. 캐글 Home Credit Default Risk 시작하기
Home Credit Default Risk 개요 및 전체 데이터 모델 설명 미리보기 13:44
Kaggle Private Score와 Public Score 02:54
application 데이터 세트의 주요 피처 설명과 피처 분류 미리보기 15:20
application 데이터 세트 기본 분석과 시각화 - 01 15:57
application 데이터 세트 기본 분석과 시각화 - 02 14:03
application 데이터 세트 기본 Preprocessing 수행 14:56
application 데이터 세트 기반으로 첫번째 모델 학습 및 성능 평가 20:57
application 데이터 세트 주요 피처 EDA 수행 - 01(연속형 값 분석) 미리보기 18:55
application 데이터 세트 주요 피처 EDA 수행 - 02(카테고리값 분석) 14:24
application 데이터 세트 주요 피처 EDA 수행 - 03(상관도 및 Heatmap) 13:49
application 데이터 세트 Feature Engineering 수행 - 01 18:59
application 데이터 세트 Feature Engineering 수행, 두번째 모델 학습 및 성능 평가 12:46
섹션 3. previous_application 데이터 가공/모델 학습/평가
previous_application 데이터 및 피처 설명 미리보기 13:46
previous_application 집합레벨 확인 및 EDA 수행 - 01 12:33
previous_application 주요 피처 EDA 수행 - 연속형 값 분석 11:31
previous_application 주요 피처 EDA 수행 - 카테고리값 분석 04:42
previous_application에서 group by를 활용한 Feature Engineering 기본 - 01 미리보기 14:49
previous_application에서 group by를 활용한 Feature Engineering 기본 - 02 08:10
previous_application Feature Engineering - 03 12:07
previous_application Feature Engineering - 04 08:40
previous_application Feature Engineering - groupby case when 활용 - 05 17:57
previous_application Feature Engineering - groupby case when 활용 06 16:00
previous_application 최종 가공 데이터 세트 생성, 모델 학습 및 평가 10:11
previous_application Feature Engineering 내용 정리 및 함수화 16:29
섹션 4. Bayesian Optimization 기반 LightGBM 하이퍼 파라미터 튜닝
LightGBM 개요 미리보기 09:19
LightGBM 특징과 주요 하이퍼 파라미터 설명 14:54
기존 하이퍼 파라미터 튜닝 방법 문제점 미리보기 08:29
구글 코랩 사용시 유의사항 00:58
Bayesian Optimization 개요 - 01 06:21
Bayesian Optimization 개요 및 실습 08:16
Bayesian Optimization을 이용한 LightGBM 하이퍼 파라미터 튜닝 개요 10:36
Bayesian Optimization을 이용한 LightGBM 하이퍼 파라미터 튜닝 실습 - 01 17:19
Bayesian Optimization을 이용한 LightGBM 하이퍼 파라미터 튜닝 실습 - 02 14:42
Bayesian Optimization을 이용한 LightGBM 하이퍼 파라미터 튜닝 실습 - 03 06:33
섹션 5. bureau와 bureau_bal 데이터 가공/모델 학습/평가
bureau와 bureau_bal 데이터 세트 개요 및 피처 설명 09:58
bureau 데이터 세트 EDA 수행 12:14
bureau 데이터 세트 Feature Engineering 수행 - 01 16:00
bureau와 bureau_bal 데이터 세트 Feature Engineering 수행 - 02 15:05
bureau와 bureau_bal 데이터 세트 Feature Engineering 내용 정리, 모델 학습 및 평가 08:37
섹션 6. pos_cash_balance, installments, credit_card_balance 데이터 가공/모델 학습/평가
pos_cash_balance, installment, credit_card_balance 데이터 및 주요 피처 설명 10:25
pos_cash_balance, installment, credit_card_balance Feature Engineering 개요 및 주요 데이터 분석 15:37
pos_cash_balance 데이터 세트 Feature Engineering - 01 13:36
pos_cash_balance 데이터 세트 Feature Engineering - 02 09:32
installments 데이터 세트 Feature Engineering 08:45
credit_card_balance 데이터 세트 Feature Engineering 10:12
pos_cash_balance, installment, credit_card_balance 최종 데이터 생성, 모델 학습 및 평가 08:24
섹션 7. OOF(Out Of Fold) Prediction으로 전체 데이터 세트 학습 및 평가
OOF(Out Of Prediction) 개요 15:53
OOF Prediction으로 전체 데이터 세트 학습 및 평가 - 01 19:26
OOF Prediction으로 전체 데이터 세트 학습 및 평가 - 02 03:58
고려할 추가 작업 02:56
강의 게시일 : 2020년 09월 14일 (마지막 업데이트일 : 2024년 01월 17일)
수강평 총 65개
수강생분들이 직접 작성하신 수강평입니다.
4.9
65개의 수강평
5점
4점
3점
2점
1점
VIEW 추천 순 최신 순 높은 평점 순 낮은 평점 순 평점 순 높은 평점 순 낮은 평점 순
문송합니다 thumbnail
5
pandas를 어느정도 다룬다고 생각했는데, 단순히 할줄 안다고 성능이 나오는게 아니더라고요. 복잡한 데이터 세트에서 머신러닝 알고리즘을 어떻게 적용해야 하는지, 그리고 데이터 전처리, 분석 도메인에 대한 중요성을 알려준 고마운 강의 입니다. 이걸 들으니 캐글에서 왜 순위가 안 올라가는지 알것 같아 현타가 옵니다. 올해 상금도 빵빵하던데...
2020-10-07
Idea thumbnail
5
실제 캐글 데이터를 사용하며 실전 감각을 익힐 수 있는 좋은 강의인 것 같습니다. 권철민님 강의를 처음 접한게 "머신러닝 완벽 가이드"라는 강의를 들을 때였는데, 이번 강의도 역시 너무 좋네요... 항상 좋은 강의 만들어주셔서 너무 감사드리고, 무엇보다 제가 진짜 마음에 들었던 부분은 Q&A를 올리면 빠른 시간내에 답변을 달아주신다는 점...이 부분이 굉장히 좋은 point가 아닐까 싶습니다. 물론 강의 퀄리티는 말할 것도 없구요. 다시 한 번 감사드립니다.
2020-10-29
막김 thumbnail
5
권철민 선생님 강의는 무조건 별 5개
2020-09-14
런닝맨 thumbnail
5
이론은 어느정도 알고 있는데, 그동안 구현 부분에서 개인적으로 미진한 부분이 많았는데, 요 강의가 최대한 쉽고, 자세하게 되어 있어서 많은 도움이 되었습니다.
2020-10-12
양문일 thumbnail
5
좋은강의항상감사합니다. 이번강의역시최고네요
2020-10-11
연관 로드맵
이 강의가 포함된 잘 짜여진 로드맵을 따라 학습해 보세요!