캐글 Advanced 머신러닝 실전 박치기
캐글 Advanced 머신러닝 실전 박치기
수강정보
(16개의 수강평)
237명의 수강생
66,000원
지식공유자 : 권 철민
70회 수업 · 총 12시간 55분 수업
기간 : 평생 무제한 시청
수료증 : 발급 강의
수강 난이도 : 중급이상

이 강의는

본 강의는 Kaggle의 Home Credit Default Risk 경연대회 머신 러닝 모델을 구현을 통해, 여러분을 실전적인 머신 러닝 구축 전문가로 한단계 실력을 업그레이드 할 수 있도록 만들어진 강의 입니다.

머신러닝, 실전 구현 능력까지 든든하게!
직접 경연대회 머신러닝 모델을 구현해보세요.

강의 소개 🤖

안녕하십니까,

파이썬 머신러닝 완벽 가이드의 저자 권철민 입니다.

실무에서 필요로 하는 진정한 머신러닝 전문가가 되기 위해서는 머신러닝에 대한 이해뿐만 아니라 데이터 처리 능력, 적용 업무의 이해 능력들을 함께 갖추고 있어야 합니다. 하지만 이러한 능력들은 실제적으로 경험해 보지 않거나 계획적으로 훈련되지 않는다면, 많은 시간과 노력을 들여도 얻기 힘든 요소입니다.

이번에 출시한 "캐글 Advanced 머신러닝 실전 박치기" 강의는 캐글의 "Home Credit Default Risk 경연대회" 머신러닝 문제를 저와 함께 구현해 나가면서 이러한 3가지 요소들을 배양해 나가고, 여러분의 실전 머신러닝 구현 능력과 자신감을 확실하게 업그레이드 할 수 있도록 만들어졌습니다.

'Home Credit Default Risk 경연대회' 문제는 실무 업무에서 활용될 수 있는 유형의 데이터 모델과 여러 개의 데이터 세트들을 가지고 있습니다.

본 강의는 이 경연대회 문제를 기반으로 데이터 모델과 분석 도메인, 데이터 분석 EDA, Feature Engineering, 하이퍼 파라미터 튜닝, 모델 성능 최적화 등 머신러닝의 중요 영역에 대해서 여러분이 충분히 해당 능력을 배양할 수 있도록 상세하고 자세하게 코드를 구현해 가면서 설명을 드릴 것입니다.

강의에서 사용되는 머신러닝 알고리즘은 많은 캐글러들이 사랑하는 LightGBM 입니다. 여러분은 구현 과제를 통해서 Home Credit Default Risk 경연대회 상위 10%에 해당하는 구현 코드를 작성하게 되며, 이를 통해 성능을 최적화한 모델 구현에 대한 자신감을 얻으실 수 있을 것입니다.

본 강의의 특징 📚

1. 상세하고 쉬운 실습 코드 설명과 Live Coding을 통한 실제 구현 이해도 향상

강의 대부분이 실습 코드를 설명하는 부분으로 되어 있으며, 매우 자세하게 코드들을 Line by Line으로 설명해 드립니다. 특히 중요한 구현 부분의 경우는 저와 함께 Live Coding을 수행할 수 있도록 만들어져서, 여러분의 구현 이해도를 더욱 향상시켜드릴 것입니다.

2. 캐글이나 데이콘 등의 경연 대회를 대비한 성능 중심 모델 구현 능력 향상

본 강의를 통해 캐글이나 데이콘 등의 경연대회에서 높은 성적을 올릴 수 있도록 고급 머신러닝 기법, Feature Engineering 및 하이퍼 파라미터 튜닝 기법들을 배우시게 됩니다.
이를 통해 여러분을 머신러닝 경연 대회에 자신감을 가지고 임하실 수 있는 수준으로 올려드릴 것입니다.

3. 실무에서 필요로 하는 머신 러닝 전 영역에 대한 자세한 설명

본 강의는 데이터 모델과 분석 도메인, 데이터 분석 EDA, Feature Engineering, 하이퍼 파라미터 튜닝, 모델 성능 최적화 등 머신 러닝 전 영역에 대해서 자세한 설명을 담고 있습니다.
여러분은 이를 통해서 비단 머신러닝뿐만 아니라 데이터 가공과 업무 도메인 이해 능력을 향상시킬 수 있으며, 이를 통해 실무에서 필요로 하는 머신러닝 전문가로서의 기틀을 마련할 수 있을 것입니다.

강의 선수 지식 🏃‍♂️

파이썬 머신러닝 완벽 가이드  인프런 베스트셀러 
화제의 공룡책, 동영상으로 만나보세요!

본 강의는 머신러닝에 대한 기반 이해를 미리 갖추고 있는 수강생 분들을 위한 Advanced 머신러닝 프로젝트 강의입니다. '파이썬 머신러닝 완벽 가이드' 책의 1~4장(분류)까지 정도의 내용을 이해하고 있다고 가정하고 만들어졌습니다.

'파이썬 머신러닝 완벽 가이드' 책이나 강의를 접하지 않으셨더라도 '파이썬 머신러닝 완벽 가이드' 목차를 미리 보시고 4장 분류까지의 목차 내용이 낯설지 않다면 수강하실 수 있습니다.

실습 환경 💻

 Jupyter Notebook   Colab 

12GB 이상 RAM 메모리를 가지는 환경이라면 어디서나 가능합니다. (8GB 정도는 마지막 실습 단계에서 메모리 부족으로 실습이 어려울 수 있습니다). 12GB 이상 RAM이 없는 경우에는 구글 클라우드 $300 무료 크레딧을 이용하여 서버를 생성하거나, 구글 코랩(Colab)을 이용하시면 됩니다. 강의의 첫번째 섹션에서 이들 실습환경을 어떻게 설정하는지 자세히 설명드립니다.

실습 코드는 주피터 노트북 형태로 제공되며 구글 코랩(Colab)용 실습 코드가 별도로 제공됩니다.  실습 코드, 강의 자료는 본 강의 세션 자료실에서 다운로드를 받으실 수 있습니다.

인프런이 만난 사람 👨‍💻

권철민님 인터뷰를 읽어보세요 | 보러가기

이런 걸 배워요

  • 캐글의 실전 경연 대회 문제를 접하면서 머신러닝 실전 구현 능력을 업그레이드
  • 실무에 머신러닝을 적용할 수 있는 수준으로 구현 능력 업그레이드
  • 머신러닝 모델의 성능 개선 방법
  • 머신러닝을 위한 데이터 분석 능력 향상
  • 머신러닝 Feature Engineering의 구체적인 구현 방법

도움 되는 분들

  • 캐글이나 데이콘에 본격적으로 도전하시는 분
  • 실무에 머신러닝을 어떻게 적용할지 고민하시는 분
  • 머신러닝 이해를 넘어서 실전적인 모델 구현을 원하시는 분
  • 머신러닝 실력을 한단계 업그레이드 하시려는 분
  • 머신러닝 모델의 성능 개선 방법이 필요하신 분
  • 어려운 문제를 접하면서 실전 머신러닝 능력을 키우시길 원하시는 분

선수 지식

  • 파이썬 머신러닝에 대한 이해
  • 파이썬과 Pandas 구현 능력

공개 일자

2020년 9월 14일 (마지막 업데이트 일자 : 2020년 9월 14일)

지식공유자 소개

(전) 엔코아 컨설팅

(전) 한국 오라클

(전) Kx Systems 기술 이사

AI 프리랜서 컨설턴트

파이썬 머신러닝 완벽 가이드 저자

4.9
16개의 수강평
default_profile.png
양문일 1달 전
좋은강의항상감사합니다. 이번강의역시최고네요
default_profile.png
런닝맨 1달 전
이론은 어느정도 알고 있는데, 그동안 구현 부분에서 개인적으로 미진한 부분이 많았는데, 요 강의가 최대한 쉽고, 자세하게 되어 있어서 많은 도움이 되었습니다.
image
박성일 2달 전
권철민 선생님 강의는 무조건 별 5개

교육과정

모두 펼치기 70 강의 12시간 55분
섹션 1. 머신러닝을 위한 데이터 분석 이해
10 강의 96 : 36
머신러닝 전문가의 지향점
04 : 41
데이터 분석 도메인의 이해 - 01
11 : 32
데이터 분석 도메인의 이해 - 02
07 : 12
분석을 위한 데이터 처리 기술 기본과 조인(Join) 이해
12 : 45
Pandas 조인(Join) 실습
07 : 32
Group by의 이해
15 : 03
Pandas Group by 실습
12 : 09
Group by Case When의 이해
08 : 03
Pandas Group by Case When 실습
06 : 39
피처 엔지니어링(Feature Engineering)의 이해
11 : 00
섹션 2. 캐글 Home Credit Default Risk 시작하기
12 강의 176 : 44
Home Credit Default Risk 개요 및 전체 데이터 모델 설명
13 : 44
Kaggle Private Score와 Public Score
02 : 54
application 데이터 세트의 주요 피처 설명과 피처 분류
15 : 20
application 데이터 세트 기본 분석과 시각화 - 01
15 : 57
application 데이터 세트 기본 분석과 시각화 - 02
14 : 03
application 데이터 세트 기본 Preprocessing 수행
14 : 56
application 데이터 세트 기반으로 첫번째 모델 학습 및 성능 평가
20 : 57
application 데이터 세트 주요 피처 EDA 수행 - 01(연속형 값 분석)
18 : 55
application 데이터 세트 주요 피처 EDA 수행 - 02(카테고리값 분석)
14 : 24
application 데이터 세트 주요 피처 EDA 수행 - 03(상관도 및 Heatmap)
13 : 49
application 데이터 세트 Feature Engineering 수행 - 01
18 : 59
application 데이터 세트 Feature Engineering 수행, 두번째 모델 학습 및 성능 평가
12 : 46
섹션 3. previous_application 데이터 가공/모델 학습/평가
12 강의 146 : 55
previous_application 데이터 및 피처 설명
13 : 46
previous_application 집합레벨 확인 및 EDA 수행 - 01
12 : 33
previous_application 주요 피처 EDA 수행 - 연속형 값 분석
11 : 31
previous_application 주요 피처 EDA 수행 - 카테고리값 분석
04 : 42
previous_application에서 group by를 활용한 Feature Engineering 기본 - 01
14 : 49
previous_application에서 group by를 활용한 Feature Engineering 기본 - 02
08 : 10
previous_application Feature Engineering - 03
12 : 07
previous_application Feature Engineering - 04
08 : 40
previous_application Feature Engineering - groupby case when 활용 - 05
17 : 57
previous_application Feature Engineering - groupby case when 활용 06
16 : 00
previous_application 최종 가공 데이터 세트 생성, 모델 학습 및 평가
10 : 11
previous_application Feature Engineering 내용 정리 및 함수화
16 : 29
섹션 4. Bayesian Optimization 기반 LightGBM 하이퍼 파라미터 튜닝
10 강의 97 : 27
LightGBM 개요
09 : 19
LightGBM 특징과 주요 하이퍼 파라미터 설명
14 : 54
기존 하이퍼 파라미터 튜닝 방법 문제점
08 : 29
구글 코랩 사용시 유의사항
00 : 58
Bayesian Optimization 개요 - 01
06 : 21
Bayesian Optimization 개요 및 실습
08 : 16
Bayesian Optimization을 이용한 LightGBM 하이퍼 파라미터 튜닝 개요
10 : 36
Bayesian Optimization을 이용한 LightGBM 하이퍼 파라미터 튜닝 실습 - 01
17 : 19
Bayesian Optimization을 이용한 LightGBM 하이퍼 파라미터 튜닝 실습 - 02
14 : 42
Bayesian Optimization을 이용한 LightGBM 하이퍼 파라미터 튜닝 실습 - 03
06 : 33
섹션 5. bureau와 bureau_bal 데이터 가공/모델 학습/평가
5 강의 61 : 54
bureau와 bureau_bal 데이터 세트 개요 및 피처 설명
09 : 58
bureau 데이터 세트 EDA 수행
12 : 14
bureau 데이터 세트 Feature Engineering 수행 - 01
16 : 00
bureau와 bureau_bal 데이터 세트 Feature Engineering 수행 - 02
15 : 05
bureau와 bureau_bal 데이터 세트 Feature Engineering 내용 정리, 모델 학습 및 평가
08 : 37
섹션 6. pos_cash_balance, installments, credit_card_balance 데이터 가공/모델 학습/평가
7 강의 76 : 31
pos_cash_balance, installment, credit_card_balance 데이터 및 주요 피처 설명
10 : 25
pos_cash_balance, installment, credit_card_balance Feature Engineering 개요 및 주요 데이터 분석
15 : 37
pos_cash_balance 데이터 세트 Feature Engineering - 01
13 : 36
pos_cash_balance 데이터 세트 Feature Engineering - 02
09 : 32
installments 데이터 세트 Feature Engineering
08 : 45
credit_card_balance 데이터 세트 Feature Engineering
10 : 12
pos_cash_balance, installment, credit_card_balance 최종 데이터 생성, 모델 학습 및 평가
08 : 24
섹션 7. OOF(Out Of Fold) Prediction으로 전체 데이터 세트 학습 및 평가
4 강의 42 : 13
OOF(Out Of Prediction) 개요
15 : 53
OOF Prediction으로 전체 데이터 세트 학습 및 평가 - 01
19 : 26
OOF Prediction으로 전체 데이터 세트 학습 및 평가 - 02
03 : 58
고려할 추가 작업
02 : 56
지식공유자 되기
많은 사람들에게 배움의 기회를 주고,
경제적 보상을 받아보세요.
지식공유참여
기업 교육을 위한 인프런
“인프런 비즈니스” 를 통해 모든 팀원이 인프런의 강의들을
자유롭게 학습하는 환경을 제공하세요.
인프런 비즈니스