実践データサイエンス Part 3. 機械学習の理解
hjkim3
企業のデジタル変換(DT)、人工知能(AI)の導入は、機械学習モデルの構築から始まります。ただし、機械学習技術の範囲は非常に広く、最適な方法を選択するには基本的な概念を明確に理解する必要があります。この講義では、機械学習の基本概念を明確に理解するために必要な重要な内容を5つの例を中心に紹介します。
Basic
Machine Learning(ML)
ビジネス実践では、データナビゲーション(EDA)、データクリーニング、スケーリング、異常値処理、対数変換、カテゴリエンコーディングなどが必要な理由と、どのように対処する必要があるかを学びます。また、テーブルデータの結合、(非定型)時系列データの処理方法を学びます。
学習した受講者のレビュー
5.0
허룡
いつもフレンドリーで落ち着いた説明なので、理解しやすくなります。ありがとうございます!
5.0
홍성은 (sungkenh)
Pythonデータの前処理を勉強するのに多くの助けになりました。 データの前処理に必要な様々な方法論と実際のデータを使った実践が良かった。
5.0
alcatraz76
個人的にはとてもきれいで素晴らしい講義だと思います。 以前Part1も受講していましたが、川の進歩上の内容が少し難しくなった部分はありますが、問題なく理解できました。
データ分析と機械学習の最初のステップとして、1)データクリーニング、2)スケーリング、3)異常値処理、4)データ変換(ログ変換、カテゴリエンコーディング)の基本概念を学びます。
本格的なデータ分析の前に、データの全体的な特性を調べて、収集したデータが分析に適しているかどうかを調べる探索的分析(EDA)方法を学びます。
テーブルデータ、時系列データ処理を学び、concat、join、merge、groupby、pivot_table、walk forward予測の概念を明確に理解します。
核心だけを入れた!
データ分析に必要なデータ前処理
ビッグデータ分析、機械学習、ディープラーニング、人工知能、デジタル変換(DT)など、最近最も需要が高い技術分野です。ほとんどすべての業界でこれらの技術を担当するデータサイエンティストの育成が、最も重要で緊急の状況です。
企業でデータを扱う実務家が最も時間を費やす必要があり、実際にデータ分析(機械学習)のパフォーマンスに最大の影響を与える業務がデータ前処理です。
このレッスンでは、効果的なデータナビゲーション(EDA)方法、およびデータ前処理の4つの主要な内容であるデータクリーニング、スケーリング、異常値処理、データ変換の概念について説明します。
欠測値処理実習、テイター変換実習、線形分類予測など理論に基づいた実習を通じて、現業で必要なデータ分析をすぐに適用できるように支援します。
実際には、テーブル構造データをさまざまな方法で組み合わせる作業が頻繁に必要です。 concat、append、join、merge、groupby、および pivot_table 関数の違いを理解し、どのような場合にどの関数が有用かを説明します。
また、実務で非定型データである時系列データを扱うことが多いです。 datetimeを利用する方法と順次時系列予測方法であるwalk forward予測を説明し、線形モデルを用いたバイナリ分類および回帰予測モデルを紹介します。
実習コードショートカット👉 https://github.com/data-labs/preprocessing
学習対象は
誰でしょう?
データの前処理は、データ分析のパフォーマンスに影響を与える最も重要なプロセスです。
テーブル構造データを付ける作業、時系列データを扱う基本概念を理解し、現業ですぐに活用したい方におすすめです。
前提知識、
必要でしょうか?
Pythonの基本的な知識が必要です。
921
受講生
78
受講レビュー
11
回答
4.8
講座評価
3
講座
「壊れたラジオ、直せる?」
私が電子工学科に入学した後、友人から受けた質問です。まあ、こう答えました。「電子工学科ではラジオを作る原理を学ぶのであって、壊れた電化製品を直すのは僕たちの仕事じゃないし……」
理論で武装した専門家よりも、問題解決者が必要とされる場合の方が多いです。私は、実戦での問題解決の方がより重要だと考えています。
最近は機械学習を用いて、金融、エネルギー、電子、重装備、物流、新薬開発、食品など、産業領域の課題を解決する仕事に携わっていますが、本当に学ぶことも多く、やるべきことが無限にある領域だと感じています。本職は教授(江原大学 コンピュータ工学科)ですが、現場の課題解決に関心が高く、さまざまな役職を兼任しています。AI新薬開発支援センター長、KAIST兼任教授、そしてデータサイエンスラボの代表を務めています。
AI時代に最も必要とされる人材は、実戦問題を解決できるデータサイエンティストであると信じており、皆様が市場から求められるデータサイエンティストになられることを願っています。
全体
19件 ∙ (4時間 13分)
全体
18件
4.7
18件の受講レビュー
受講レビュー 5
∙
平均評価 4.6
受講レビュー 2
∙
平均評価 5.0
5
Pythonデータの前処理を勉強するのに多くの助けになりました。 データの前処理に必要な様々な方法論と実際のデータを使った実践が良かった。
良い評価ありがとうございます。
受講レビュー 2
∙
平均評価 5.0
5
個人的にはとてもきれいで素晴らしい講義だと思います。 以前Part1も受講していましたが、川の進歩上の内容が少し難しくなった部分はありますが、問題なく理解できました。
自分で解決したのは幸いです。気になる内容は質問してください〜
受講レビュー 2
∙
平均評価 5.0
¥6,809
知識共有者の他の講座を見てみましょう!
同じ分野の他の講座を見てみましょう!