실전 데이터 사이언스 Part 3. 머신러닝의 이해
김화종
기업의 디지털 전환(DT), 인공지능(AI) 도입은 머신러닝 모델 구축에서 시작합니다. 그러나 머신러닝 기술 범위는 매우 넓으며 최적의 방법을 선택하려면 기본 개념을 분명히 이해해야 합니다. 이 강의에서는 머신러닝의 기본 개념을 명확하게 이해하는데 필요한 핵심 내용을 다섯개의 예제를 중심으로 소개합니다.
초급
머신러닝
Learn why and how to handle data exploration (EDA), data cleaning, scaling, outlier handling, log transformation, and categorical encoding in real-world applications. You will also learn how to merge tabular data and process (unstructured) time series data.
As the first step in data analysis and machine learning, you will learn the basic concepts of 1) data cleaning, 2) scaling, 3) outlier handling, and 4) data transformation (log transformation, category encoding).
Before starting full-scale data analysis, you will learn the exploratory analysis (EDA) method to examine the overall characteristics of the data and determine whether the collected data is suitable for analysis.
Learn how to process table data and time series data, and clearly understand the concepts of concat, join, merge, groupby, pivot_table, and walk forward prediction.
Contains only the essentials!
Essential data preprocessing for data analysis
Big data analytics, machine learning, deep learning, artificial intelligence, and digital transformation (DT) are among the most in-demand technology fields today. In nearly every industry, training data scientists to handle these technologies is crucial and urgent.
Data preprocessing is the task that requires the most time from data handlers in companies and has the greatest impact on data analysis (machine learning) performance.
This lecture covers effective data exploration (EDA) methods and the four key concepts of data preprocessing: data cleaning, scaling, outlier handling, and data transformation.
We help you immediately apply data analysis required in the field through theory-based exercises such as missing value handling, data transformation, and linear classification prediction.
In practice, combining table-structured data in various ways is often necessary. Understand the differences between the concat, append, join, merge, groupby, and pivot_table functions, and explain which functions are useful in which situations.
In practice, we often deal with unstructured time series data. We'll explain how to use datetime and the sequential walk-forward time series prediction method, and introduce binary classification and regression prediction models using linear models.
Go to the practice code 👉 https://github.com/data-labs/preprocessing
Who is this course right for?
Data preprocessing is the most important process that determines the performance of data analysis. This will be helpful for those who want to systematically organize the data preprocessing methods required for practical work.
This is recommended for those who want to understand the basic concepts of pasting table structure data and handling time series data and apply them immediately in the field.
Need to know before starting?
Basic knowledge of Python is required.
919
Learners
77
Reviews
11
Answers
4.8
Rating
3
Courses
"고장난 라디오 고칠 수 있어?"
제가 전자공학과에 입학한 후 친구로부터 받은 질문입니다. 뭐, 대답은 했습니다. "전자공학과에서는 라디오 만드는 원리를 배우는 것이지 고장난 전자제품 고치는 것은 우리 일이 아니고..."
이론으로 무장한 전문가보다 문제 해결사가 필요한 경우가 더 많습니다. 저는 실전 문제 해결이 더 중요하다고 생각합니다.
최근에는 머신러닝으로 금융, 에너지, 전자, 중장비, 물류, 신약개발, 식품 등 산업 영역의 문제를 해결하는 일을 하고 있는데, 정말 배울 것도 많고 할 일도 무궁무진한 영역인 것 같습니다. 본업은 교수지만 (강원대 컴퓨터공학과), 현장의 문제해결에 관심이 많아 여러 겸직을 하고 있습니다. AI신약개발지원센터장, KAIST 겸임교수, 그리고 데이터사이언스랩 대표를 맡고 있습니다.
AI 시대에 가장 필요한 인재는 실전 문제를 해결할 수 있는 데이터 사이언티스트라고 믿으며 여러분 모두 인기 있는 데이터 사이언티스트가 되기를 바랍니다.
All
19 lectures ∙ (4hr 13min)
All
17 reviews
4.8
17 reviews
Reviews 2
∙
Average Rating 5.0
5
파이썬 데이터 전처리 공부에 많은 도움이 되었습니다. 데이터 전처리에 필요한 다양한 방법론과 실제 데이터를 사용한 실습이 좋았습니다.
좋은 평가 감사합니다.
Reviews 2
∙
Average Rating 5.0
5
개인적으로 매우 깔끔하고 훌륭한 강의라고 생각됩니다. 이전 Part1도 수강하였는데, 강의 진도상 내용이 조금 어려워진 부분은 있으나 문제없이 이해 할 수 있었습니다.
스스로 해결하셨다니 다행입니다. 궁금한 내용은 질문해주세요~
$42.90
Check out other courses by the instructor!
Explore other courses in the same field!