本番データサイエンス Part2.データ前処理
hjkim3
ビジネス実践では、データナビゲーション(EDA)、データクリーニング、スケーリング、異常値処理、対数変換、カテゴリエンコーディングなどが必要な理由と、どのように対処する必要があるかを学びます。また、テーブルデータの結合、(非定型)時系列データの処理方法を学びます。
初級
Python
Pythonの文法は勉強したけれど、いざデータを扱おうとすると途方に暮れていませんか? NumPyやPandasを学ぶべきだとは分かっていても、どこからどう繋げればいいのか悩んでいたなら、このPART2がその答えになります。 全50講のデータ分析カリキュラムのうち、PART2では実際にデータを読み込み、精製・加工しながら統計的に解釈するプロセスを段階的に経験します。単にライブラリや文法を学ぶだけでなく、どのような状況でどのツールを選択すべきかという基準を確立します。 Pythonコードがわかるレベルから、これからデータを扱うレベルへと移行する転換点が、まさにこのPART2です。
NumPyを活用して配列ベースの演算を効率的に行い、データ計算を構造的に処理することができます。
Pandasのデータフレームを使用して実際のデータを読み込み、選択、クリーニング、加工、統計処理まで、分析の基本プロセスを実行できます。
欠損値の処理とデータの統計計算を通じて、データの状態を自ら点検することができます。
MatplotlibとSeabornを活用してデータを視覚的に表現し、グラフを通じてその意味を解釈することができます。
単にコードを実行するレベルではなく、「この状況ではどのツールを選択すべきか」を判断できる基準を身につけることができます。
その後、機械学習や人工知能の学習段階へと拡張できるデータ処理の基盤を整えることになります。
学習対象は
誰でしょう?
Pythonの基礎は理解しているが、実際のデータを扱った経験がない方
NumPyとPandasを学ぶべきだとは分かっているけれど、どこから始めればいいか分からず途方に暮れている方
データフレームを扱うのが難しいと感じていた方
エクセルを超えてPythonでデータ分析をしてみたい方
欠損値処理とデータクリーニング、および統計計算を体系的に学びたい方
グラフは描いてみたものの、どのグラフをいつ使うべきかの判断が難しい方
機械学習を学ぶ前に、データ処理の基礎をしっかりと固めたい方
Pythonコードがわかるレベルから、データを扱うレベルへと成長したい方
前提知識、
必要でしょうか?
基本的なPythonの文法(変数、関数、繰り返しなど)を理解していれば受講可能です。もし変数や関数、そしてスコープの概念がまだ明確でない場合は、PART 1を先に受講することをお勧めします。基礎が整理されると、このパートの理解度と学習スピードが格段に上がります。
NumPyとPandasは初めての方でも大丈夫です。講義で基礎から段階的に説明します。
データ分析の経験がなくても、実習を通じて自然に身につけられるよう構成されています。ただし、コードを読んで簡単に修正した経験があれば、学習の助けになります。
30年間、開発と事業の現場で実戦経験を積んできました。
1999年に国内で初めてウェブメールを単独開発し、サムスン電子のモバイルコンテンツプラットフォームを設計して640億ウォン規模の純利益を創出した経験があります。
その後、東南アジアとオセアニア13カ国の事業戦略を統括し、B2B事業部長と新事業推進チーム長を務め、
現在は人工知能ベースのソリューション企業を運営しており、AIとデータ分析を実戦プロジェクトに適用しています。
Pythonを学んだと言う多くの人が、いざコードを目の前にすると、どこから手をつければいいのか戸惑ってしまいます。
細かな文法事項を知らないからではなく、なぜそのように動作するのかという構造を学ぶ機会がなかったからです。
私の講義は、コードを暗記する講義ではありません。
データを読み解く思考力を養う過程です。
30年の開発およびIT実務経験
サムスン電子 東南アジア/オセアニア13カ国の事業戦略を策定
モバイルコンテンツ事業で640億ウォンの純利益を達成
2,000人以上の教育および実践カリキュラムの設計
AIサービス企画ガイドブック著者
私は理論を実務から切り離しません。
現場で検証された基準をお伝えします。
コードがなぜそのように動作するのか説明できるようになります。
データを見ると、何から始めるべきかが見えてきます
分析プロセスを自ら設計できるようになります。
私の講義は、一度で終わる講義ではありません。
このコースは、データ思考を養うシリーズのPART 2です。
全体
12件 ∙ (9時間 50分)
講座資料(こうぎしりょう):
1. オリエンテーション
58:26
2. [ボーナス] 実習環境の準備(必要な方のみ視聴)
01:18:40
3. 配列の基礎と構造の理解
44:18
4. 配列の生成と初期化戦略
39:21
5. 配列演算とインデックスの原理
51:43
7. データフレームの構造と設計の理解
01:09:49
8. データ選択と操作のパターン
50:26
9. 欠損値処理と記述統計分析
47:57
10. データの巡回と表現方式の理解
41:46
同じ分野の他の講座を見てみましょう!
期間限定セール、あと3日日で終了
¥16,170
70%
¥6,872