• 카테고리

    질문 & 답변
  • 세부 분야

    데이터 분석

  • 해결 여부

    해결됨

판다스와 머신러닝, 문제풀이 쪽 세부 커리큘럼을 알 수 있을까요?

22.03.16 17:47 작성 조회수 236

0

수강생들을 위해 만든 질문입니다~

답변 1

답변을 작성해보세요.

0

DQ K님의 프로필

DQ K

지식공유자

2022.03.16

[판다스]

: 현재 빅분기 실기는 판다스 활용 능력이 가장 크게 적용되며, 아래 내용에 대한 반복숙달은 필수적입니다. 이외의 다소 지엽적이거나 현 출제경향 상에선 출제되기 어려운 난이도의 문제는 예제나 모의고사에 추가 문제로 제공

1. 기초 : 데이터프레임 생성, loc/iloc 등을 이용한 조회, 슬라이싱 기초, EDA 기초
2. Beginner 01 : 로컬에서 데이터 읽기, method를 이용한 슬라이싱 초급, EDA, 수학통계 method, 결측치 처리, 인덱스 초기화
3. Beginner 02 : 정렬, 슬라이싱 중급, 데이터 핸들링(map, lambda, apply), 사용자 함수 정의(def)
4. Intermediate 01 : src 경로로 데이터 읽기, 슬라이싱을 통한 데이터 EDA, 데이터 분석을 통한 결측치 처리, 조건문을 이용한 슬라이싱, 칼럼값에 대한 method(unique, value_counts() 등), google colab 사용을 위한 library
5. Intermediate 02 : 이전까지의 내용을 복합적으로 이용한 데이터 전처리(기출유형 풀어보기), 데이터 프레임 병합


[머신러닝]

: 기계적으로 풀 수 있는 실전압축코드 제공, but 이론적 이해를 위해 초급자 내용과 중급자 내용, 그리고 이 둘을 핵심요약하는 커리큘럼으로 구성되어 있습니다. 시간이 촉박한 분들이라면 초급자 내용과 핵심요약, 그리고 실전압축코드를 외우는 식으로도 문제를 풀 수 있도록 기출 2회, 3회 및 모의고사를 구성.

1. Beginner 01 : 전체 머신러닝 프로세스 학습(기초1), help 함수 사용법, LogisticRegression, Scaling, Holdout, score_metrics
2. Beginner 02 : RandomForest, XGBoost를 이용한 회귀, 분류 모델 사용, 회귀&분류 모델의 상호변환, 전체 머신러닝 프로세스 복습(기초2)
3. Intermediate : Embedding(One-hot Encoding), 차원축소, 정규화, 스케일러 손코딩, Hyper-parameter Tuning, Ensemble, Submission & Check
4. 핵심요약 : 위의 과정 중 Intermediate의 지엽적인 내용을 제외한 전체를 다른 데이터셋과 문제를 풀어보며 요약정리
5. 실전압축코드 : 시간이 촉박한 사람, 도저히 머신러닝에 대한 이해가 어려운 사람 등을 위해 복붙만 해도 점수를 얻을 수 있는 코드 제공, 단 데이터을 읽고, 결측치 처리까지는 본인이 할 수 있어야 함.

[문제풀이]

1. 홈페이지 예제 풀이
2. 기출 2회차
3. 기출 3회차
4. 모의고사 1회차(강의 미제공)

5. 모의고사 2회차(제작 중 - 강의 미제공)

Jongdeok  Heo님의 프로필

Jongdeok Heo

2022.05.27

선생님, 저는 visual studio로 작업중입니다.,  유첨화일을 멜로 받을 수 있을지요? csv, xls등 유첨자료를 멜로 주실 수 있으시면 jdheo777@naver.com으로 부탁드립니다

DQ K님의 프로필

DQ K

지식공유자

2022.05.29

초반에 판다스를 사용해 학습하는 과정에서는 코랩에서 사용되는 파일을 사용하고 있으나,

이후에는 제 개인 깃허브에 직접 가공해 올려놓은 데이터를 사용하게 됩니다.

이러한 데이터의 경우, 로컬 환경에서 작업하더라도 동일한 방식으로 불러올 수 있습니다.

또한 초반에 코랩 환경에서 제공되는 파일들의 경우, sklearn 라이브러리의 dataset 모듈을 통해

불러올 수 있는 코드를 정리해 조만간 업로드하도록 하겠습니다.

 

감사합니다.