강의

멘토링

커뮤니티

BEST
Data Science

/

Data Engineering

本番データサイエンス Part2.データ前処理

ビジネス実践では、データナビゲーション(EDA)、データクリーニング、スケーリング、異常値処理、対数変換、カテゴリエンコーディングなどが必要な理由と、どのように対処する必要があるかを学びます。また、テーブルデータの結合、(非定型)時系列データの処理方法を学びます。

難易度 初級

受講期間 無制限

  • hjkim3
Python
Python
Python
Python

学習した受講者のレビュー

学習した受講者のレビュー

4.7

5.0

허룡

100% 受講後に作成

いつもフレンドリーで落ち着いた説明なので、理解しやすくなります。ありがとうございます!

5.0

홍성은 (sungkenh)

100% 受講後に作成

Pythonデータの前処理を勉強するのに多くの助けになりました。 データの前処理に必要な様々な方法論と実際のデータを使った実践が良かった。

5.0

alcatraz76

100% 受講後に作成

個人的にはとてもきれいで素晴らしい講義だと思います。 以前Part1も受講していましたが、川の進歩上の内容が少し難しくなった部分はありますが、問題なく理解できました。

受講後に得られること

  • データ分析と機械学習の最初のステップとして、1)データクリーニング、2)スケーリング、3)異常値処理、4)データ変換(ログ変換、カテゴリエンコーディング)の基本概念を学びます。

  • 本格的なデータ分析の前に、データの全体的な特性を調べて、収集したデータが分析に適しているかどうかを調べる探索的分析(EDA)方法を学びます。

  • テーブルデータ、時系列データ処理を学び、concat、join、merge、groupby、pivot_table、walk forward予測の概念を明確に理解します。

核心だけを入れた!
データ分析に必要なデータ前処理

ビッグデータ分析、機械学習、ディープラーニング、人工知能、デジタル変換(DT)など、最近最も需要が高い技術分野です。ほとんどすべての業界でこれらの技術を担当するデータサイエンティストの育成が、最も重要で緊急の状況です。

企業でデータを扱う実務家が最も時間を費やす必要があり、実際にデータ分析(機械学習)のパフォーマンスに最大の影響を与える業務がデータ前処理です。


📝コアデータ前処理

このレッスンでは、効果的なデータナビゲーション(EDA)方法、およびデータ前処理の4つの主要な内容であるデータクリーニング、スケーリング、異常値処理、データ変換の概念について説明します。


👩‍💻理論+実習講義の構成


タイタニックサバイバーを予測するには?


欠測値処理実習、テイター変換実習、線形分類予測など理論に基づいた実習を通じて、現業で必要なデータ分析をすぐに適用できるように支援します。


🙋‍♂️現場で必要なトピック

テーブルを扱う
時系列データ処理

実際には、テーブル構造データをさまざまな方法で組み合わせる作業が頻繁に必要です。 concat、append、join、merge、groupby、および pivot_table 関数の違いを理解し、どのような場合にどの関数が有用かを説明します。

また、実務で非定型データである時系列データを扱うことが多いです。 datetimeを利用する方法と順次時系列予測方法であるwalk forward予測を説明し、線形モデルを用いたバイナリ分類および回帰予測モデルを紹介します。


📕川の特徴

  • すべての内容は実践コードで説明されています。

実習コードショートカット👉 https://github.com/data-labs/preprocessing

  • サンプルコードは、あなたがビジネスですぐに活用できるように設定しました。
  • コードは簡潔ですが、重要な内容が含まれており、使いやすく書かれています。

👩‍💻コアデータサイエンス

データサイエンスの基礎となる言語Python。
本講義はPythonの基礎知識が選ばれる講義です。
Python言語の基礎知識がない人は
本番データサイエンス Part1. Python入門講義を通じて
選手の知識学習をおすすめします。

こんな方に
おすすめです

学習対象は
誰でしょう?

  • データの前処理は、データ分析のパフォーマンスに影響を与える最も重要なプロセスです。

  • テーブル構造データを付ける作業、時系列データを扱う基本概念を理解し、現業ですぐに活用したい方におすすめです。

前提知識、
必要でしょうか?

  • Pythonの基本的な知識が必要です。

こんにちは
です。

921

受講生

78

受講レビュー

11

回答

4.8

講座評価

3

講座

「壊れたラジオ、直せる?」

私が電子工学科に入学した後、友人から受けた質問です。まあ、こう答えました。「電子工学科ではラジオを作る原理を学ぶのであって、壊れた電化製品を直すのは僕たちの仕事じゃないし……」

理論で武装した専門家よりも、問題解決者が必要とされる場合の方が多いです。私は、実戦での問題解決の方がより重要だと考えています。

最近は機械学習を用いて、金融、エネルギー、電子、重装備、物流、新薬開発、食品など、産業領域の課題を解決する仕事に携わっていますが、本当に学ぶことも多く、やるべきことが無限にある領域だと感じています。本職は教授(江原大学 コンピュータ工学科)ですが、現場の課題解決に関心が高く、さまざまな役職を兼任しています。AI新薬開発支援センター長、KAIST兼任教授、そしてデータサイエンスラボの代表を務めています。

AI時代に最も必要とされる人材は、実戦問題を解決できるデータサイエンティストであると信じており、皆様が市場から求められるデータサイエンティストになられることを願っています。

カリキュラム

全体

19件 ∙ (4時間 13分)

講座掲載日: 
最終更新日: 

受講レビュー

全体

18件

4.7

18件の受講レビュー

  • dfeafe님의 프로필 이미지
    dfeafe

    受講レビュー 8

    平均評価 4.9

    4

    100% 受講後に作成

    学校の授業のようにじっくりと基礎的でいいです。

    • hjkim3
      知識共有者

      授業のように進んだのが正しいです。良い成果を得てください。

  • victory1791791577님의 프로필 이미지
    victory1791791577

    受講レビュー 5

    平均評価 4.6

    5

    100% 受講後に作成

    いつもフレンドリーで落ち着いた説明なので、理解しやすくなります。ありがとうございます!

    • hjkim3
      知識共有者

      良い評価ありがとうございます。

  • sungkenh0540님의 프로필 이미지
    sungkenh0540

    受講レビュー 2

    平均評価 5.0

    5

    100% 受講後に作成

    Pythonデータの前処理を勉強するのに多くの助けになりました。 データの前処理に必要な様々な方法論と実際のデータを使った実践が良かった。

    • hjkim3
      知識共有者

      良い評価ありがとうございます。

  • alcatraz761636님의 프로필 이미지
    alcatraz761636

    受講レビュー 2

    平均評価 5.0

    5

    100% 受講後に作成

    個人的にはとてもきれいで素晴らしい講義だと思います。 以前Part1も受講していましたが、川の進歩上の内容が少し難しくなった部分はありますが、問題なく理解できました。

    • hjkim3
      知識共有者

      自分で解決したのは幸いです。気になる内容は質問してください〜

  • inyong08hwang2545님의 프로필 이미지
    inyong08hwang2545

    受講レビュー 2

    平均評価 5.0

    5

    100% 受講後に作成

    良い講義ありがとうございます。

    ¥6,809

    hjkim3の他の講座

    知識共有者の他の講座を見てみましょう!

    似ている講座

    同じ分野の他の講座を見てみましょう!