Thumbnail
모임/부트캠프 모집마감
데이터 사이언스 데이터 분석

데이터 사이언티스트 뭐하는 사람인가요? A to Z 대공개, 유니콘 기업에서 원하는 역량 대시보드

초급

100%

0원

15,246,000원
신청 기간

2023.12.01 20:29 ~ 12.19 23:59 (한국 표준시)

기간

약 5개월 (2023.12.27 ~ 2024.06.11)

장소
온라인으로 진행하는 모임입니다
폴더에 추가 공유

처음 기획부터 끝까지 ‘데이터 사이언티스트’ 필수 역량 하나에 맞춘 유일한 과정 마침내 탄생! 데이터분석툴로 대시보드 만드는 방법만 더 이상 배우지마세요!

🤍 Point 1 🤍
현업 데이터 사이언티스트 & 모두의연구소 AI 연구원 Special Unit✨

데이터 사이언티스트 필수 역량에 맞춰 완성한 교육 프로그램! 

🤍 Point 2 🤍
기업이 원하는 실전형 비즈니스 프로젝트 경험✨

데이터 4대 인기 분야 핵심 기업별 연계 프로젝트! 

🤍 Point 3 🤍
3년 동안 1,000명이 선택한 아이펠✨

주입식 부트캠프가 아닌 자기주도형 '커뮤니티 교육! 

데이터 사이언티스트 "직무 본질"에 집중한 교육,
왜 없을까?🤔

바로 "필수 역량"을 제대로 이해하고 이지 않기 때문에!

 

데이터에 대한 니즈는 같아도
데이터 사이언티스트의 니즈는 다르니까

 

🤍 Point 1 🤍
마침내 한곳에 모이다

 

🤍 Point 2 🤍
마침내 답을 찾다

 

 

🤍Point 3 🤍
마침내 완성하다

 

1,000명이 선택한
AI학교 아이펠


안녕하세요
모두의연구소 입니다.
모두의연구소의 썸네일

[모두의연구소 : 2024 과학기술정보통신부 장관 표창]
[모두의연구소 : 2024 디지털인재 리더스 클럽 선정]
[모두의연구소: K-디지털 트레이닝 훈련기관 중 유일한 대통령 표창 수상]
모두의연구소는 기존 주입식 부트캠프 교육을 탈피해 스스로 답을 찾는 커뮤니티형(Learning By Doing)액티브 러닝 기반, 교육의 진정성을 담은 새로운 SW/AI 과정을 제공합니다

문의 이메일 aiffel-cs@modulabs.co.kr

프로그램

   1주차

온보딩 * 모두의연구소와 아이펠의 교육 철학 이해
* 모두의연구소가 지향하는 커뮤니티형 교육이란 무엇인가
* 모두의연구소 김승일 소장님과 함께 진행합니다
* 아이펠 교육 방식의 이해
* 게임형 퀘스트 유형 설명 및 실습하기
* 과정에서 목표로 하는 그루의 성장 이미지에 대해 공유하기
2주차
데이터
사이언티스트로 가는 첫걸음

데이터 사이언티스트의 역할과 직무에 대한 이해 및 리눅스, Git, 파이썬 기본기 등 데이터 사이언티스트가 되기 위한 기초 소양 갖추기
* 리눅스,파이썬 개념에 대한 이해
* 터미널, IDE 개념 실습

* Git 이해 및 실습

* 터미널로 배우는 리눅스 운영 체제: 명령어 실습, 운영 체제, 커널, 셸
* 파이썬 실습 및 프로젝트 수행: 함수/변수/제어문/자료형/재귀함수/리스트와 컴프리헨션/제너레이터/예외처리/파이써닉 코딩 학습

3주차
SQL을 사용하여 데이터베이스
다루기(수집)
데이터 수집부터 해석-처리까지
(데이터 수집 및 데이터 해석, SQL과 파이썬을 활용한 데이터 처리 실습)
* 데이터베이스와 테이블 구조의 개념 이해 및 실무 데이터 해석 실습
* 데이터, 데이터베이스, 테이블, 스키마 개념 이해
* SQL 기본 문법(join, groupby, window)의 원리 이해 및 사용 실습
* pandasql 라이브러리, mySQL 실습
* SELECT, FROM, WHERE, 비교, 논리, 산술 연산
* LIKE, Wildcard, Alias, ORDER BY, IF, CASE WHEN, THEN, CAST
* 데이터 조건, 별칭, 정렬, 조건 제거, 조건문, 타입변환
* COUNT, SUM, AVG, MAX, MIN, GROUP BY, HAVING, 집계, 그룹화, 조건
* PK, FK, JOIN, UNION, Subquery
* 기본키, 외래키, 다중테이블, 데이터 붙이기, 서브쿼리
* 데이터 크롤링의 이해 및 실습
* Python, 데이터 크롤링, 웹의 구조와 통신
* 인터넷, 프로토콜, API(Web, HTTP, REST API), 크롤링(urllib, BeautifulSoup, Requests)
* 날씨 API 가져오기 코드
* 네이버 환율 정보 크롤링 실습(BeautifulSoup, Requests, pandas)
4주차
비정제데이터
체험하기
통계적 기법을 활용한 비정제 데이터의 정제 및 BigQuery 플랫폼 기반 프로젝트 수행
* 통계적 기법을 활용한 데이터 탐색 및 정제
* Feature Engineering
* 수치형 데이터 결측치, 중복데이터, 이상치
(z-score, IQR), 정규화(standarization, min-max)
* 범주형 데이터, 원핫인코딩, 구간화(Binning)
* Encoding, Scaling, Feature Selection 기법 실습
* 데이터 시각화
* 히스토그램을 활용하여 데이터 분포 다루기
* 박스 플롯, 바이올린 플롯, 산점도, 상관행렬 히트맵
5~6주차  
적절한 데이터
분석을 위한
기초 통계
데이터사이언스를 위한 기초 통계 개념의 이해 및 데이터 통계적 기법을 활용한
데이터 탐색(EDA)의 수행

* 데이터 분석에서 통계의 역할과 기초 개념 이해
* 통계학의 개념 이해하기, 모집단과 표본, 통계분석의 기초 * 추론 통계, 가설 검정
* 데이터로 모집단의 성질 추정(추론 통계~신뢰)
* 가설 검정: 가설 검정과 p 값, 다양한 가설 검정(t 검정-분산 분석-카이제곱 검정)
* 상관관계와 회귀: 두 양적 변수의 관계 분석
* 통계 모형화: 선형회귀에서 일반화 선형 모형으로
* 인과관계와 상관관계
* 베이즈 통계
* 통계분석과 관련된 다른 방법들 익히기: 주성분 분석부터 기계 학습까지
* 통계 모형의 이해: 통계 모형, 기계학습 모형, 수리 모형
7~8주차  
머신러닝을 활용한 다양한 데이터 다루기&데이터톤 데이터 핸들링, 시각화부터 머신러닝, CV/NLP의 원리 이해 및 프로젝트 까지.
한큐에 끝내는 머신러닝 기반의 데이터 다루기 실습
* 데이터 EDA, 전처리 및 시각화 실습
* numpy, pandas, matplotlib 등 라이브러리를 활용하여 데이터 EDA, 전처리 및 시각화
* 지도학습(분류 및 회귀)와 비지도학습 머신러닝 프로젝트 수행
* scikit-learn 라이브러리를 활용하여 지도학습(분류 및 회귀)와 비지도학습 머신러닝 프로젝트를 수행
* 지도학습 알고리즘의 이해
* 로지스틱 회귀(Logistic Regression), 의사결정 나무(Decision Trees), 랜덤포레스트(Random Forests), 그라디언트 부스팅(Gradient Boosting)의 원리 이해 및 설명
* 비지도학습 알고리즘의 이해
* 군집화(Clustering)와 차원 축소(Dimensionality Reduction)를 위한 K-평균(K-Means), 주성분 분석(PCA)의 원리를 이해 및 설명
[데이터톤]
* 주어진 데이터를 활용하여 팀 프로젝트 완성하기
* Task에 알맞은 EDA와 전처리 실습하기
* 데이터를 해석하는 데 적합한 모델 탐색과 선정 근거 마련하기
* 모델 성능 평가를 위한 지표 설정과 추론 결과 분석하기
* 모델 성능 향상을 위한 근거 분석과 논리적인 방법론 선택하기
* 아이디어를 뽐내고 함께 응원과 피드백 받기
9주차  
금융 시계열
체험하기
기업 금융 데이터를 활용한 데이터 분석 실습
* 시계열 데이터 이해와 전처리
* 시계열 데이터의 추세, 계절성, 정상성을 이해하고, 직접 눈으로 확인하기 위한 스킬 함양
* 로그 변환, 차분 등을 통해 데이터를 전처리하는 방법 이해 및 실습
* 데이터 시각화와 패턴 분석
* Matplotlib를 사용한 데이터 시각화와 시계열 데이터의 패턴을 분석하는 스킬 함양
* ACF와 PACF를 활용하여 데이터의 자기상관성의 이해
* 시계열 데이터 분류와 전처리 (tsfresh 라이브러리)
* Robot execution failures 데이터셋을 활용하여 시계열 데이터를 분류하는 방법의 이해
* 데이터를 정상화하고 추세와 계절성을 제거하는 과정 실습
* ARIMA 모델과 시계열 분석 (ADF 테스트, 결측치 처리)
* ARIMA 모델의 이해 및 시계열 데이터의 안정성을 검정(ADF 테스트)
* 결측치 처리 방법의 습득 및 모델 성능 평가 실습
* 추세 데이터 라벨링과 시계열 분류 (피처 엔지니어링, 분류 모델)
* 추세 데이터 라벨링과 피처 엔지니어링을 통한 데이터를 가공하고 분류 모델 구축
* 다양한 분류 알고리즘을 활용하여 데이터를 분류하고 모델 성능을 평가
10~11주차  
딥러닝의 기초부터 다양한 프로젝트 실습 * 딥러닝의 개념 이해
* 인공 신경망의 개념과 역사 이해 * 퍼셉트론, 다층퍼셉트론, 역전파 알고리즘, 기울기 소실, 과적합 상태 이해
* 텐서와 연산 * 텐서 개념, 타입, 타입 변환, 텐서 연산 등과 관련된 코드 연습 문제 실습
* 딥러닝 구조와 모델 이해
* Tensorflow, Keras 프레임워크 이해 및 코드 실습
* sequential, functional, subclassing API 코드 간단 실습
* 레이어 개념의 이해(dense, activation, flatten layer)
* 모델 상세 구조에 따라 functional API 또는 subclassing 방식의 모델 구현
* 딥러닝 모델 학습
* 손실함수, 옵티마이저(SGD, Adam), 지표, 딥러닝 모델 학습
* 경사하강법, 옵티마이저, 학습률, 지표, mae, accuracy, 모델학습플로우, 간단 코드실습
* 모델 저장과 콜백
* mnist 딥러닝 모델 실습, 모델 저장 로드, 콜백, earlystopping, tensorboard
* 모델 학습 기술 이해
* 미니배치, 스케일링(표준화,정규화), 가중치 초기화, 하이퍼파라미터 튜닝, 활성화함수 등 모델 학습 기술, 과소, 과대적합, 케라스 IMDB 데이터 다루기
* Convolutional Neural Network 이해
* Channel Convolution, Pooling, CNN을 활용한 네트워크 구조의 이해
* Object Detection, Segmentation 등 세부 task의 이해
* Transfer Learning을 활용한 효율적인 fine-tuning
12~13주차  
NLP 프로젝트
톺아보기

자연어 데이터 처리의 개념과 원리를 이해하고, 초거대 언어 모델(LLM)까지 살펴보기
* 텍스트 처리 및 기본 개념의 이해

* 문자열 인코딩/디코딩 및 정규 표현식 활용의 이해.
* 파일, 디렉터리, 모듈, 패키지 등 프로그래밍 기초 개념을 이해하고 데이터 형식 (CSV, XML, JSON) 다루기
* 텍스트 전처리와 임베딩
* 텍스트 데이터를 전처리하고 다양한 토큰화 기술의 이해.
* Word2Vec, FastText, ELMo 등 텍스트 임베딩 기술 습득.
* 텍스트 데이터를 벡터로 변환하는 방법과 워드 임베딩 학습
* Word2Vec, FastText, GloVe 등을 활용하여 텍스트를 벡터로 표현하는 방법의 이해
* RNN과 텍스트 분석
* 순환 신경망 (RNN)과 텍스트 분석에 대한 심화 학습
* 영화 리뷰 분류와 한국어 Word2Vec 프로젝트 수행.
* TF-IDF, 나이브 베이즈 분류 등 텍스트 분석 기술의 활용
* 텍스트 생성과 챗봇 구축
* 텍스트 생성 및 챗봇 모델을 만들고 프로젝트를 수행
* 인코더/디코더 구조와 자연어 생성 기술 습득
* 최신 언어 모델 및 효율적 학습 기술의 이해
* 최신 언어 모델 (LLM)의 특징과 주요 아키텍처의 이해 및 활용
* LLM 모델을 효율적으로 학습하는 기술의 습득 및 최신 언어 모델 기반의 프로젝트 수행

14주차  
추천 시스템
체험하기
딥러닝 기반 추천시스템 원리 이해 및 실습하기
* 추천 시스템의 기본 개념 및 종류 이해
* 코사인 유사도와 콘텐츠 기반 필터링, 협업 필터링 (사용자 행동 양식 데이터), 잠재 요인 분석 (LFA) 학습 및 적용
* 비슷한 스타일의 아티스트로 추천 및 데이터 처리
* 비슷한 스타일의 아티스트로 추천 방법의 학습 및 실제 데이터를 다루기 위한 pandas와 데이터 처리 기술 습득
* Implicit 데이터와 협업 필터링, MF 모델, CSR Matrix를 활용한 추천 시스템 구축
* 다음 아이템 예측 및 세션 기반 추천
* 유저의 다음 클릭 또는 구매를 예측하는 추천 시스템의 구현
* 세션 기반 추천을 이해하고 E-Commerce 데이터를 다루며, GRU4REC와 성능 평가 지표의 활용 실습
* 딥러닝 기반 추천 시스템
* 딥러닝을 활용하여 추천 시스템을 개발하는 개념의 이해
* 딥러닝 프레임워크 기반의 추천 시스템을 위한 다양한 신경망 모델 구현 실습
15~16주차  
데이터 분석 실무 알아보기 데이터 사이언티스트 실무에 바로 적응하기 위한 마지막 준비!
* 개발 환경 구축 및 협업
* Jupyter Notebook을 벗어난 코드의 버전 관리& 모듈화를 위한 새로운 개발 환경 구축 실습 * 로컬 환경에서 딥러닝 프로젝트를 개발하고 관리하는 방법 실습
* VSCode와 Docker를 활용하여 효과적으로 개발하고, 깃허브 collaborator 설정을 통한 협업 관리 실습
* 하이퍼파라미터 튜닝 및 모델 개발 * model.fit() 이외의 방법을 사용하여 세부적인 모델 컨트롤과 디버깅의 수행
* 커스텀 데이터와 트레이너를 구현하고, 모듈화를 통해 코드의 가독성과 재사용성 제고
* TensorFlow의 tf.data와 tf.keras.model을 상속하여 딥러닝 모델 개발
* 캐글 Yogapose 이미지 및 EfficientNetB0를 사용하여 MoveNet annotation 작업 수행
* MLOps 및 모델 배포
* MLOps의 개념과 중요성을 이해하고, 모델의 지속적인 훈련 및 배포 관리
* KerasTuner를 활용하여 하이퍼파라미터 튜닝 수행
* 모델 배포를 위한 TensorFlow Serving API와 tflite 파일 생성 실습.
17~23주차  
최종 프로젝트 개인 아이디어 성장과 기업 주제 기반의 프로젝트 진행
* Project Planning과 PoC
* 아이디어를 구현하기 위한 합리적인 프로젝트 계획하기
* 계획의 구현 가능성과 문제점을 파악하고, 주어진 환경 자원에 맞춰 고도화하기
* Project Managing
* 팀장/팀원으로서 기간 내에 계획된 프로젝트를 완수하기 위해 시간 관리, 자원 배분 등 매니징 능력 키우기
* Project 실행 및 문제 해결 역량 기르기
* 프로젝트 수행 중에 발생하는 다양한 문제를 해결하기 위한 현실적인
실행 단계 도출 능력 기르기

자주 묻는 질문

취소 및 환불 규정

  • 모임/부트캠프의 신청 취소/환불 기간은 지식공유자가 설정한 신청기간과 동일합니다.

  • 모임/부트캠프의 신청 정보 수정 및 취소/환불은 ‘구매내역’에서 할 수 있습니다.

  • 유료 모임/부트캠프의 경우, 24시간이내 설문 내용 미제출시 신청 및 결제내역이 자동취소됩니다.

※ 인프런은 통신판매 중개자이며, 해당 모임/부트캠프의 주최자가 아닙니다.

신청기간이종료됐어요