실전 데이터 사이언스 Part 3. 머신러닝의 이해
김화종
기업의 디지털 전환(DT), 인공지능(AI) 도입은 머신러닝 모델 구축에서 시작합니다. 그러나 머신러닝 기술 범위는 매우 넓으며 최적의 방법을 선택하려면 기본 개념을 분명히 이해해야 합니다. 이 강의에서는 머신러닝의 기본 개념을 명확하게 이해하는데 필요한 핵심 내용을 다섯개의 예제를 중심으로 소개합니다.
Basic
머신러닝
ビジネス実践では、データナビゲーション(EDA)、データクリーニング、スケーリング、異常値処理、対数変換、カテゴリエンコーディングなどが必要な理由と、どのように対処する必要があるかを学びます。また、テーブルデータの結合、(非定型)時系列データの処理方法を学びます。
データ分析と機械学習の最初のステップとして、1)データクリーニング、2)スケーリング、3)異常値処理、4)データ変換(ログ変換、カテゴリエンコーディング)の基本概念を学びます。
本格的なデータ分析の前に、データの全体的な特性を調べて、収集したデータが分析に適しているかどうかを調べる探索的分析(EDA)方法を学びます。
テーブルデータ、時系列データ処理を学び、concat、join、merge、groupby、pivot_table、walk forward予測の概念を明確に理解します。
核心だけを入れた!
データ分析に必要なデータ前処理
 
    
ビッグデータ分析、機械学習、ディープラーニング、人工知能、デジタル変換(DT)など、最近最も需要が高い技術分野です。ほとんどすべての業界でこれらの技術を担当するデータサイエンティストの育成が、最も重要で緊急の状況です。
企業でデータを扱う実務家が最も時間を費やす必要があり、実際にデータ分析(機械学習)のパフォーマンスに最大の影響を与える業務がデータ前処理です。
このレッスンでは、効果的なデータナビゲーション(EDA)方法、およびデータ前処理の4つの主要な内容であるデータクリーニング、スケーリング、異常値処理、データ変換の概念について説明します。
 
    
 
    
欠測値処理実習、テイター変換実習、線形分類予測など理論に基づいた実習を通じて、現業で必要なデータ分析をすぐに適用できるように支援します。 
 
     
    実際には、テーブル構造データをさまざまな方法で組み合わせる作業が頻繁に必要です。 concat、append、join、merge、groupby、および pivot_table 関数の違いを理解し、どのような場合にどの関数が有用かを説明します。
また、実務で非定型データである時系列データを扱うことが多いです。 datetimeを利用する方法と順次時系列予測方法であるwalk forward予測を説明し、線形モデルを用いたバイナリ分類および回帰予測モデルを紹介します。 
 
    
 実習コードショートカット👉 https://github.com/data-labs/preprocessing
学習対象は 
誰でしょう?
データの前処理は、データ分析のパフォーマンスに影響を与える最も重要なプロセスです。
テーブル構造データを付ける作業、時系列データを扱う基本概念を理解し、現業ですぐに活用したい方におすすめです。
前提知識、 
必要でしょうか?
Pythonの基本的な知識が必要です。
921
受講生
77
受講レビュー
11
回答
4.8
講座評価
3
講座
"고장난 라디오 고칠 수 있어?"
제가 전자공학과에 입학한 후 친구로부터 받은 질문입니다. 뭐, 대답은 했습니다. "전자공학과에서는 라디오 만드는 원리를 배우는 것이지 고장난 전자제품 고치는 것은 우리 일이 아니고..."
이론으로 무장한 전문가보다 문제 해결사가 필요한 경우가 더 많습니다. 저는 실전 문제 해결이 더 중요하다고 생각합니다.
최근에는 머신러닝으로 금융, 에너지, 전자, 중장비, 물류, 신약개발, 식품 등 산업 영역의 문제를 해결하는 일을 하고 있는데, 정말 배울 것도 많고 할 일도 무궁무진한 영역인 것 같습니다. 본업은 교수지만 (강원대 컴퓨터공학과), 현장의 문제해결에 관심이 많아 여러 겸직을 하고 있습니다. AI신약개발지원센터장, KAIST 겸임교수, 그리고 데이터사이언스랩 대표를 맡고 있습니다.
AI 시대에 가장 필요한 인재는 실전 문제를 해결할 수 있는 데이터 사이언티스트라고 믿으며 여러분 모두 인기 있는 데이터 사이언티스트가 되기를 바랍니다.
全体
19件 ∙ (4時間 13分)
全体
17件
4.8
17件の受講レビュー

受講レビュー 2
∙
平均評価 5.0
5
파이썬 데이터 전처리 공부에 많은 도움이 되었습니다. 데이터 전처리에 필요한 다양한 방법론과 실제 데이터를 사용한 실습이 좋았습니다.
좋은 평가 감사합니다.

受講レビュー 2
∙
平均評価 5.0
5
개인적으로 매우 깔끔하고 훌륭한 강의라고 생각됩니다. 이전 Part1도 수강하였는데, 강의 진도상 내용이 조금 어려워진 부분은 있으나 문제없이 이해 할 수 있었습니다.
스스로 해결하셨다니 다행입니다. 궁금한 내용은 질문해주세요~
¥6,794
知識共有者の他の講座を見てみましょう!
同じ分野の他の講座を見てみましょう!