Thumbnail
모임/부트캠프 모집중
데이터 사이언스 데이터 엔지니어링

[데이터 사이언티스트 과정]현업 데이터 사이언티스트가 만든 유일한 커리큘럼을 꼭 확인하세요! 대시보드

초급

100%

0원

15,246,000원
신청 기간

2024.04.17 11:50 ~ 07.17 23:50 (한국 표준시)

교육 기간

약 3개월 (2024.07.23 ~ 11.14)

폴더에 추가 공유

기획부터 끝까지 ‘데이터 사이언티스트’ 필수 역량에 맞춘 유일한 커리큘럼 마침내 탄생! 커리큘럼의 차이가 데이터 전문가 역량의 차이!


강의 포인트 🤍 Point 1 🤍🙆‍♀️
현업 데이터 사이언티스트 & 모두의연구소 AI 연구원 Special Unit✨

  • 데이터 사이언티스트 필수 역량에 맞춰 완성한 유일한 초핵심 교육 프로그램
  • 6개월 간 상주하는 AI 전문 멘토 퍼실리테이터와 함께 자기주도성과 문제해결력을 높입니다
  • 퍼실리테이터와 함께 현업 데이터 사이언티스트가 만든 커리큘럼으로 배우세요

강의 포인트 🤍 Point 2 🤍🙆‍♀️
3년 동안 1,000여 명이 선택한 아이펠 교육 철학

  • 주입식 부트캠프가 아닌 자기주도형 "커뮤니티" 교육" 방식

커뮤니티 기반 성장형 교육의 핵심 ‘퍼실리테이터' 와 함께하는 6개월

안녕하세요
모두의연구소 입니다.
모두의연구소의 썸네일

[모두의연구소: K-디지털 트레이닝 훈련기관 중 유일한 대통령 표창 수상]
모두의연구소는 기존 주입식 부트캠프 교육을 탈피해 스스로 답을 찾는 커뮤니티형(Learning By Doing)액티브 러닝 기반, 교육의 진정성을 담은 새로운 SW/AI 과정을 제공합니다

문의 이메일 aiffel-cs@modulabs.co.kr

커리큘럼

 

 온보딩&데이터 사이언티스트로 가는 첫 걸음
1~2주차
모두의연구소와 아이펠의 교육 철학 이해
모두의연구소가 지향하는 커뮤니티형 교육이란 무엇인가
아이펠의 교육 방식의 이해
게임형 퀘스트 유형 이해 및 실습하기
과정에서 목표로 하는 그루의 성장 이미지를 그리고 공유하기
데이터 사이언티스트의 역할과 직무에 대한 이해
[데이터 사이언티스트로 가는 첫 걸음]
리눅스,파이썬 개념에 대한 이해
터미널, IDE 개념 실습
Git 이해 및 실습
터미널로 배우는 리눅스 운영 체제: 명령어 실습, 운영 체제, 커널, 셸
파이썬 실습 및 프로젝트 수행: 함수/변수/제어문/자료형/재귀함수/리스트와 컴프리헨션/제너레이터/예외처리/파이써닉 코딩 학습
SQL을 사용하여 데이터베이스 다루기
3주차
SQL 기본 문법 이해 및 활용 실습
쿼리문, 데이터 필터링, 비교/논리/산술 연산자
조건문, 정렬, 중복제거, 데이터 타입 변환
집계, 그룹화, 그룹화한 데이터 조건
SQL 프로젝트 : 모두몰의 일별 매출액 분석
PV(Page View)와 UV(Unique Visits) 증가 또는 감소에 따른 분석
사용자당 평균 수익(ARPU) 유료 결제 사용자당 평균수익(ARPPU) 분석
퍼널 분석: 고객은 어디서 이탈하고 있을까?
리텐션 분석: Rolling Retention, Range Retention
SQL 프로젝트: 고객 세그먼테이션
데이터 전처리 (결측, 중복, 오류 등)
RFM 스코어 (최신성(Recency), 구매 빈도(Frequency), 구매 가치(Monetary)
추가 Feature 추출 (제품 다양성, 평균 구매 주기, 구매 취소 경향성)
SQL로 전처리하여 완성한 데이터 CSV로 추출 (파이썬 연결)
파이썬 활용한 고객 데이터 기반 그룹핑 (클러스터링, 시각화)
비정제데이터 체험하기
4주차
Data Cleaning (프로젝트: 택시요금 데이터 다루기)
결측 데이터 처리
이상치 탐지 및 처리
중복 데이터 처리 및 데이터 형태 변환
텍스트, 시계열 데이터 처리
Data Transformation (프로젝트: 연봉/자동차 가격 데이터 다루기)
데이터 병합
집계 및 그룹화, 피벗테이블
로그(log), 원-핫 인코딩 (One-hot encoding)
스케일링, 주성분 분석(PCA)
Feature Engineering (프로젝트: 스피드 데이팅 / 신용거래 데이터 다루기)
이상치 처리(Outlier)
평가(Rating)관련 피처 생성 및 활용
데이터 사이언티스트가 알려주는 피처 엔지니어링 실무팁
적절한 데이터 분석을 위한 기초 통계
5~6주차
통계의 기본 개념
기술 통계(표준편차, 분산, 평균, 중간값)
확률분포와 표본분포, 추정
데이터 시각화 (히스토그램, 상자 그림, 산점도 등)
가설 검정
t-검정, 독립 표본 검정, 대응 표본 검정
비모수 검정 및 실습
분산분석 (사후 검정)
적합도, 독립성, 카이제곱 검정
회귀 모형
상관관계와 인과관계 (심슨의 역설, 벅슨의 역설)
선형회귀 모형 및 분석 (결정계수, 다중공선성, 절편)
로지스틱 회귀 모형(오즈비) 및 분석 (범주형 변수 예측)
통계적 기법을 활용한 프로젝트
실험 설계, A/B 테스트, 수요 예측 프로젝트 등
머신러닝을 활용한 다양한 데이터 다루기 & 데이터톤
7~8주차
데이터 EDA, 전처리 및 시각화 실습
numpy, pandas, matplotlib 등 라이브러리를 활용하여 데이터 EDA, 전처리 및 시각화
지도학습(분류 및 회귀)와 비지도학습 머신러닝 프로젝트 수행
scikit-learn 라이브러리를 활용하여 지도학습(분류 및 회귀)와 비지도학습 머신러닝 프로젝트를 수행
지도학습 알고리즘의 이해
로지스틱 회귀(Logistic Regression), 의사결정 나무(Decision Trees), 랜덤포레스트(Random Forests), 그라디언트 부스팅(Gradient Boosting)의 원리 이해 및 설명
비지도학습 알고리즘의 이해
군집화(Clustering)와 차원 축소(Dimensionality Reduction)를 위한 K-평균(K-Means), 주성분 분석(PCA)의 원리를 이해 및 설명
[데이터톤]
주어진 데이터를 활용하여 팀 프로젝트 완성하기
Task에 알맞은 EDA와 전처리 실습하기
데이터를 해석하는 데 적합한 모델 탐색과 선정 근거 마련하기
모델 성능 평가를 위한 지표 설정과 추론 결과 분석하기
모델 성능 향상을 위한 근거 분석과 논리적인 방법론 선택하기

아이디어를 뽐내고 함께 응원과 피드백 받기

금융 시계열 체험하기
9주차
시계열 데이터 이해와 전처리
시계열 데이터의 추세, 계절성, 정상성을 이해하고, 직접 눈으로 확인하기 위한 스킬 함양
로그 변환, 차분 등을 통해 데이터를 전처리하는 방법 이해 및 실습
데이터 시각화와 패턴 분석
Matplotlib를 사용한 데이터 시각화와 시계열 데이터의 패턴을 분석하는 스킬 함양
ACF와 PACF를 활용하여 데이터의 자기상관성의 이해
시계열 데이터 분류와 전처리 (tsfresh 라이브러리)
Robot execution failures 데이터셋을 활용하여 시계열 데이터를 분류하는 방법의 이해
데이터를 정상화하고 추세와 계절성을 제거하는 과정 실습
ARIMA 모델과 시계열 분석 (ADF 테스트, 결측치 처리)
ARIMA 모델의 이해 및 시계열 데이터의 안정성을 검정(ADF 테스트)
결측치 처리 방법의 습득 및 모델 성능 평가 실습
추세 데이터 라벨링과 시계열 분류 (피처 엔지니어링, 분류 모델)
추세 데이터 라벨링과 피처 엔지니어링을 통한 데이터를 가공하고 분류 모델 구축
다양한 분류 알고리즘을 활용하여 데이터를 분류하고 모델 성능을 평가
딥러닝의 기초부터 다양한 프로젝트 실습
10~11주차
딥러닝의 개념 이해
인공 신경망의 개념과 역사 이해
퍼셉트론, 다층퍼셉트론, 역전파 알고리즘, 기울기 소실, 과적합 상태 이해
텐서와 연산
텐서 개념, 타입, 타입 변환, 텐서 연산 등과 관련된 코드 연습 문제 실습
딥러닝 구조와 모델 이해
Tensorflow, Keras 프레임워크 이해 및 코드 실습
sequential, functional, subclassing API 코드 간단 실습
레이어 개념의 이해(dense, activation, flatten layer)
모델 상세 구조에 따라 functional API 또는 subclassing 방식의 모델 구현
 
딥러닝 모델 학습
손실함수, 옵티마이저(SGD, Adam), 지표, 딥러닝 모델 학습
경사하강법, 옵티마이저, 학습률, 지표, mae, accuracy, 모델학습플로우, 간단 코드실습
모델 저장과 콜백
mnist 딥러닝 모델 실습, 모델 저장 로드, 콜백, earlystopping, tensorboard
모델 학습 기술 이해
미니배치, 스케일링(표준화,정규화), 가중치 초기화, 하이퍼파라미터 튜닝, 활성화함수 등 모델 학습 기술, 과소, 과대적합, 케라스 IMDB 데이터 다루기
Convolutional Neural Network 이해
Channel Convolution, Pooling, CNN을 활용한 네트워크 구조의 이해
Object Detection, Segmentation 등 세부 task의 이해
Transfer Learning을 활용한 효율적인 fine-tuning
NLP 프로젝트 톺아보기
12~13주
텍스트 처리 및 기본 개념의 이해
문자열 인코딩/디코딩 및 정규 표현식 활용의 이해.
파일, 디렉터리, 모듈, 패키지 등 프로그래밍 기초 개념을 이해하고 데이터 형식 (CSV, XML, JSON) 다루기
텍스트 전처리와 임베딩
텍스트 데이터를 전처리하고 다양한 토큰화 기술의 이해
Word2Vec, FastText, ELMo 등 텍스트 임베딩 기술 습득
텍스트 데이터를 벡터로 변환하는 방법과 워드 임베딩 학습
Word2Vec, FastText, GloVe 등을 활용하여 텍스트를 벡터로 표현하는 방법의 이해
RNN과 텍스트 분석
순환 신경망 (RNN)과 텍스트 분석에 대한 심화 학습
영화 리뷰 분류와 한국어 Word2Vec 프로젝트 수행
TF-IDF, 나이브 베이즈 분류 등 텍스트 분석 기술의 활용
텍스트 생성과 챗봇 구축
텍스트 생성 및 챗봇 모델을 만들고 프로젝트를 수행
인코더/디코더 구조와 자연어 생성 기술 습득
최신 언어 모델 및 효율적 학습 기술의 이해
최신 언어 모델 (LLM)의 특징과 주요 아키텍처의 이해 및 활용
LLM 모델을 효율적으로 학습하는 기술의 습득 및 최신 언어 모델 기반의 프로젝트 수행
추천시스템 체험하기
14주차
추천 시스템의 기본 개념 및 종류 이해다양한 딥러닝 task 구현해보기
코사인 유사도와 콘텐츠 기반 필터링, 협업 필터링 (사용자 행동 양식 데이터), 잠재 요인 분석 (LFA) 학습 및 적용
비슷한 스타일의 아티스트로 추천 및 데이터 처리
비슷한 스타일의 아티스트로 추천 방법의 학습 및 실제 데이터를 다루기 위한 pandas와 데이터 처리 기술 습득
Implicit 데이터와 협업 필터링, MF 모델, CSR Matrix를 활용한 추천 시스템 구축
다음 아이템 예측 및 세션 기반 추천
유저의 다음 클릭 또는 구매를 예측하는 추천 시스템의 구현
세션 기반 추천을 이해하고 E-Commerce 데이터를 다루며, GRU4REC와 성능 평가 지표의 활용 실습
딥러닝 기반 추천 시스템
콜드 스타트, 다양성 등의 문제 상황 이해
추천 모델과 시스템 관리 논문과 코드 구현
Shallow 영역과 Deep 영역
어텐션을 활용한 추천시스템
AutoInt 모델 구현 및 학습, 스트림릿을 사용한 시각화
데이터 분석 실무 알아보기
15주
개발 환경 구축 및 협업
Jupyter Notebook을 벗어난 코드의 버전 관리& 모듈화를 위한 새로운 개발 환경 구축 실습
로컬 환경에서 딥러닝 프로젝트를 개발하고 관리하는 방법 실습
VSCode와 Docker를 활용하여 효과적으로 개발하고, 깃허브 collaborator 설정을 통한 협업 관리 실습
하이퍼파라미터 튜닝 및 모델 개발
model.fit() 이외의 방법을 사용하여 세부적인 모델 컨트롤과 디버깅의 수행
커스텀 데이터와 트레이너를 구현하고, 모듈화를 통해 코드의 가독성과 재사용성 제고
TensorFlow의 tf.data와 tf.keras.model을 상속하여 딥러닝 모델 개발
캐글 Yogapose 이미지 및 EfficientNetB0를 사용하여 MoveNet annotation 작업 수행
MLOps 및 모델 배포
MLOps의 개념과 중요성을 이해하고, 모델의 지속적인 훈련 및 배포 관리
KerasTuner를 활용하여 하이퍼파라미터 튜닝 수행
모델 배포를 위한 TensorFlow Serving API와 tflite 파일 생성 실습
최종 프로젝트
17~23주차
Project Planning과 PoC
아이디어를 구현하기 위한 합리적인 프로젝트 계획하기
계획의 구현 가능성과 문제점을 파악하고, 주어진 환경 자원에 맞춰 고도화하기
Project Managing
팀장, 팀원으로 기한 내 계획된 프로젝트를 완수하기 위한 시간관리
자원 배분 등 매니징 능력 등 소프트 스킬 기르기
Project 실행 및 문제해결 역량 기르기
파이프라인 구성과 커스텀 함수 등 다양한 구현 능력 기르기
구현 중 발생하는 다양한 문제 해결 능력 기르기

취소 및 환불 규정

  • 부트캠프/교육의 신청 취소/환불 기간은 지식공유자가 설정한 신청기간과 동일합니다.

  • 부트캠프/교육의 신청 정보 수정 및 취소/환불은 ‘구매내역’에서 할 수 있습니다.

  • 유료 부트캠프/교육의 경우, 24시간이내 설문 내용 미제출시 신청 및 결제내역이 자동취소됩니다.

※ 인프런은 통신판매 중개자이며, 해당 부트캠프/교육의 주최자가 아닙니다.

신청 마감

75일 남았어요!