강의

멘토링

커뮤니티

Cộng đồng Hỏi & Đáp của Inflearn

Hình ảnh hồ sơ của leadbreak
leadbreak

câu hỏi đã được viết

Thực hiện trong một lần bắn! Kỹ sư phân tích dữ liệu lớn loại công việc thực tế

판다스와 머신러닝, 문제풀이 쪽 세부 커리큘럼을 알 수 있을까요?

Đã giải quyết

Viết

·

393

0

수강생들을 위해 만든 질문입니다~

커리큘럼상세bigdata빅분기기출문제풀이판다스머신러닝자격증

Câu trả lời 1

0

DQ K님의 프로필 이미지
DQ K
Người đặt câu hỏi

[판다스]

: 현재 빅분기 실기는 판다스 활용 능력이 가장 크게 적용되며, 아래 내용에 대한 반복숙달은 필수적입니다. 이외의 다소 지엽적이거나 현 출제경향 상에선 출제되기 어려운 난이도의 문제는 예제나 모의고사에 추가 문제로 제공

1. 기초 : 데이터프레임 생성, loc/iloc 등을 이용한 조회, 슬라이싱 기초, EDA 기초
2. Beginner 01 : 로컬에서 데이터 읽기, method를 이용한 슬라이싱 초급, EDA, 수학통계 method, 결측치 처리, 인덱스 초기화
3. Beginner 02 : 정렬, 슬라이싱 중급, 데이터 핸들링(map, lambda, apply), 사용자 함수 정의(def)
4. Intermediate 01 : src 경로로 데이터 읽기, 슬라이싱을 통한 데이터 EDA, 데이터 분석을 통한 결측치 처리, 조건문을 이용한 슬라이싱, 칼럼값에 대한 method(unique, value_counts() 등), google colab 사용을 위한 library
5. Intermediate 02 : 이전까지의 내용을 복합적으로 이용한 데이터 전처리(기출유형 풀어보기), 데이터 프레임 병합


[머신러닝]

: 기계적으로 풀 수 있는 실전압축코드 제공, but 이론적 이해를 위해 초급자 내용과 중급자 내용, 그리고 이 둘을 핵심요약하는 커리큘럼으로 구성되어 있습니다. 시간이 촉박한 분들이라면 초급자 내용과 핵심요약, 그리고 실전압축코드를 외우는 식으로도 문제를 풀 수 있도록 기출 2회, 3회 및 모의고사를 구성.

1. Beginner 01 : 전체 머신러닝 프로세스 학습(기초1), help 함수 사용법, LogisticRegression, Scaling, Holdout, score_metrics
2. Beginner 02 : RandomForest, XGBoost를 이용한 회귀, 분류 모델 사용, 회귀&분류 모델의 상호변환, 전체 머신러닝 프로세스 복습(기초2)
3. Intermediate : Embedding(One-hot Encoding), 차원축소, 정규화, 스케일러 손코딩, Hyper-parameter Tuning, Ensemble, Submission & Check
4. 핵심요약 : 위의 과정 중 Intermediate의 지엽적인 내용을 제외한 전체를 다른 데이터셋과 문제를 풀어보며 요약정리
5. 실전압축코드 : 시간이 촉박한 사람, 도저히 머신러닝에 대한 이해가 어려운 사람 등을 위해 복붙만 해도 점수를 얻을 수 있는 코드 제공, 단 데이터을 읽고, 결측치 처리까지는 본인이 할 수 있어야 함.

[문제풀이]

1. 홈페이지 예제 풀이
2. 기출 2회차
3. 기출 3회차
4. 모의고사 1회차(강의 미제공)

5. 모의고사 2회차(제작 중 - 강의 미제공)

선생님, 저는 visual studio로 작업중입니다.,  유첨화일을 멜로 받을 수 있을지요? csv, xls등 유첨자료를 멜로 주실 수 있으시면 jdheo777@naver.com으로 부탁드립니다

DQ K님의 프로필 이미지
DQ K
Người đặt câu hỏi

초반에 판다스를 사용해 학습하는 과정에서는 코랩에서 사용되는 파일을 사용하고 있으나,

이후에는 제 개인 깃허브에 직접 가공해 올려놓은 데이터를 사용하게 됩니다.

이러한 데이터의 경우, 로컬 환경에서 작업하더라도 동일한 방식으로 불러올 수 있습니다.

또한 초반에 코랩 환경에서 제공되는 파일들의 경우, sklearn 라이브러리의 dataset 모듈을 통해

불러올 수 있는 코드를 정리해 조만간 업로드하도록 하겠습니다.

 

감사합니다.

Hình ảnh hồ sơ của leadbreak
leadbreak

câu hỏi đã được viết

Đặt câu hỏi