多次元配列を簡単に処理するNumPyで
データ科学の第一歩を踏み出してください!
講義のテーマ 📖
NumPy(ナンパイ)?
大規模な多次元配列を扱うPythonライブラリ、NumPy!
高速演算速度で大規模なデータを処理できます。
NumPyは、Python Pandas、SciPy、Matplotlib、Pytorchなどと共に、データ科学と機械学習、ディープラーニング運用の基盤となる代表的なPythonライブラリです。
Pythonで大規模な多次元配列、そして行列データ処理のための数値演算を可能にし、内部的にC言語で実装されているため、メモリを最小限に保ち、管理しながら同時に演算速度も非常に速いライブラリの一つです。
それでは、なぜ多次元配列を書くのでしょうか?
多次元配列(ndarray)?
多次元配列とは配列要素です。
別の配列を持つ、
2次元以上の配列を意味します。
データを処理する際、データは数字の配列で構成されて保存されます。
講義の構成と進行方法🎢
データサイエンスのPython開発環境であるGoogle Colabで実践しています。
7つのセクション、合計30余りにわたって進行し、各セクション別、トピック別にNumPyモジュールで使用できる関数を簡単な例と併せて説明します。
難しくて不慣れな線形代数の概念は、材料を通してさらに学習します。
最後のセクションでは、学んだ理論と関数に基づいて作成された例をまとめて解説し、PythonとNumPyライブラリのコード作成のスキルを強化します(実践的な例は将来追加される可能性があります)。
講義を100%活用する方法✨
Googleドライブにアップロードした練習用ファイルをダウンロードしてください。
上部のナビゲーションバーで「ファイル - ドライブにコピーを保存」をクリックすると、あなたのドライブに保存されますが、このときファイル名の末尾が「〜実習用_yjglab.ipynbのコピー」として保存されます。
このファイルには、講義を行ったセクションと焼酎制が表示されます。
講義を受講した後、その日に学んだことをもとに、自分がテーマに合ったコードを書いてみてください。
たとえば、今日のセクション2のA関数とB関数について学んだ場合は、直接理論を見ないように各関数の例を作成します。
覚えていなくても大丈夫です。 できるだけ自分が知るだけに少なく見て不足していた部分の講義内容を復習し、自分が作成したコードの使用例が学んだ内容と一致することを確認します。
- 変数、リスト、タプル、繰り返し文、条件文など、Python(Python)の基本文法を知っておく必要があります。
学習内容📚
Section 0. NumPy を起動
NumPyの簡単な紹介を始め、Pythonの実践環境を構成した後、N次元配列の基本的な概念である配列と、軸、次元、行列、テンソルを扱います。
Section 1. N次元配列(ndarray)の生成
様々な形式でN次元配列を生成する方法とデータ型、そして簡単にデータを可視化する方法を扱います。
Section 2. N次元配列の索引付け
配列のインデックスを使用して値にアクセスする方法と、特定の範囲の値を検索する方法について説明します。
Section 3. N次元配列の演算法
行列の四則演算、内積演算、比較演算など基本的な演算法とブロードキャスト演算過程を扱います。
Section 4. N次元配列の整列
配列内の要素を大小関係に従って並べ替える方法について説明します。
第5章N次元配列の形状変更
配列の形状を変形し、次元を拡張、縮小する方法を扱います。
第6章N次元配列のマージ
配列に要素を追加および削除する方法と、データをマージして分割する方法について説明します。
Section 7. 実践例
学んだことに基づいて練習の例を解きます。
予想される質問 Q&A 💬
Q. Pythonを知らなくても聞くことはできますか?
Python文法の中で、変数、リスト、タプル、反復文、条件文の理解があれば、講義をスムーズにご覧いただけます!
Q. 線形代数学を知らなくても聞けますか?
関数を説明する次元で必ず必要と思われる基本的な線形代数概念は説明しますが、その他の内容は扱っていませんでした!
Q. 非専攻者も聞くことができますか?
上記の2つの質問の答えについてのみ理解している場合は、無理なく聞くことができます!
Q. 講義を聞く前に準備すべきことはありますか?
Google Chromeブラウザを使用することをお勧めし、Colab開発環境を使用するためにGoogleアカウントにログインしている必要があります!