inflearn logo
知識共有
inflearn logo

たった2枚の文書でデータ分析と視覚化をマスターする

Pandasでデータ分析、前処理、機械学習、ディープラーニングを活用していると、いつも使う機能ばかりを使いがちです。 このような核心的な内容だけを集めて整理したPandas Cheat Sheetがあります。厚い本でPandasを学ぶのに疲れてしまった方へ、たった2枚の文書でPython Pandasをお教えします。Pandas公式チュートリアルで提供されているCheat Sheetで、Pandasの核心機能を身につけてみましょう。

難易度 初級

受講期間 無制限

Python
Python
Pandas
Pandas
Python
Python
Pandas
Pandas

お知らせ

3 件

  • todaycode님의 프로필 이미지

    こんにちは。講座を受講してくださった方々に感謝します。

    💻証券データ収集と分析で信号とノイズを探す👉 http://bit.ly/inflearn-finace-data

    講座を新たにオープンするようになりました。アーリーバード期間中に30%割引を行います。

    📈証券データで信号と騒音を探す

    現在も上り下りする株価データをリアルタイムで受け取り分析します。
    誰かが収集したデータを使用せずに直接収集する方法を学びます。
    前処理する方法を学びます。
    業務や研究に使用するデータ分析方法を身につけて適用してみることを目的としています。

    📊証券データでデータ分析を学ぶのは良い理由

    Pandasが証券会社で働くクオントによって開発されたことを知っていますか?
    証券データは、さまざまな分析方法、式、統計などを適用してみることができるデータです。

    数十、数百ページのウェブサイトの内容をエクセルに貼り付けなければならないなら?

    収集したデータがあまりにも汚れていて、どこから手をつけるべきかわからないとしたら?

    カテゴリー型データと数値型データにはいくつかの違いがあります
    データの信号とノイズを見つけるための適切な可視化方法は?
    さまざまなフォーマットのデータを扱う方法を学ぶことができます。

    移動平均、ボリンジャーバンド、MACD、RSIなどの技術分析を直接実装してみたり
    すでに実装されているライブラリを介してコードを1つ2行で描画します。
    技術分析の原理を理解し、
    HTSやMTSで見ているように、チャートを実装してみます。

    ⚡️川の特徴 

    🧹セレニウムのような重いツールを使ってこそ収集できそうだったウェブページのデータを
    ブラウザの[ネットワーク]タブを使用して、1行または2行のコードで収集する方法を学びます。
    仕事や研究に必要な情報を直接収集して分析することができます。

    📈静的な視覚化ツールだけでなく、動的な視覚化ツールの使い方を学びます。

    🛠多くのツールを一度に習得するのは難しいです。
    さまざまなツールを使用しても、コア機能だけを理解すると
    ツールが変わっても文書を見て理解できる方法を知れば
    新しいライブラリが登場しても怖くないでしょう。

    💡私たちが必要だと感じる機能は誰かが抽象化されたライブラリで作っておきました。
    新しいツールをインストールして習得する方法を学びます。

    🛠学習スキルの紹介

    🐼Pandas :Pythonの代表的なデータ分析ツールで、金融データ分析のために作成されました。
    🧮Numpy :Pythonの数値計算ツールです。
    📊 matplotlib :Pythonの代表的なデータ可視化ツールです。
    📊 seaborn : matplotlib を使いやすく抽象化した高レベルの可視化ツールで基本的な統計演算を提供します。
    📊 plotly :高レベル、低レベルの可視化機能を提供し、インタラクティブな可視化が可能です。
    📊 cufflinks : plotlyとpandasを強力につなぐ生産的なツールです。
    📈 FinanceDataReader :コードは、1つまたは2行で金融データを収集するためのツールです。
    🌏 Requests :WebページのソースコードをHTTP通信で受け取ることができるツールです。
    🔍 BeautifulSoup4 :Webページのソースコードから必要な情報を取得するためのツールです。
    ⏰ tqdm : データ収集や前処理に時間がかかる作業の進行状況を確認できます。

    📊さまざまな可視化ライブラリの使い方と違い

    画像ソース:https://pyviz.org/overviews/index.html

    💻  コードが入力されていないファイル(input)と入力されたファイル(output)の2つの練習資料を提供

    説明が書かれた空のセルに直接コードを入力し、1行1行のレッスンに従ってください。
    コードが書かれているファイルで実行し、練習を進めることもできます。
    講義を聞いて空のセルを埋めながら復習してみることもできます。

    📈HTS、MTSで見られる補助指標(移動平均、ボリンジャーバンド、RSI、MACD)を直接実装して原理を理解する

    🙋‍♀️ 予想される質問 Q&A

    非専攻者も聞くことができますか?
    データ分析は専攻/非専攻を問わず身につけておくと活用するところが多いです。企業講義を行ったことがあります。カリキュラムを補完しました。分析と可視化のための重要な機能を身につければ、業務効率を高めるのに役立ちます。

    なぜPythonでデータ分析と収集技術を学ぶのですか?
    エクセルはどんな業務を行っても会社員の必須スキルの一つですが、エクセルには読み込むことができるデータのサイズやタイプなどの限界がありますが、Pythonを通じて身につけると様々なフォーマットや大容量データも扱えるようになります。

    データ分析と収集技術を学ぶことは何ですか?
    必要なデータを収集するためにページごとに渡し、ドラッグドロップとコピーペーストで何度も何度も何度も何度も何度も何度も何度も起こります。を取ることもできるでしょう。

    講義の受講後は何ができますか?
    業務と研究で発生するデータを直接収集、分析視覚化し、生産量、在庫量、販売量、トラフィック量などに適用してみることができます。講義で投資意見を提示しません。

    講義を聞く前に準備する必要がありますか?
    Pythonの変数、数字、文字、リストなどの概念を理解していれば役に立ちます。

    クラスの内容をどの程度レベルまで扱いますか?
    証券データを収集、 処理、分析、視覚化します。 Pythonの基礎から中級までのスキルを扱います。活用してみることを目指します
    。資料の中でファイル名の末尾にoutput という名前の完成したファイルを回して、すぐ下にコードセルを作って同じようにしてみることをお勧めします。

    コンピュータのパフォーマンスはどのくらいでなければなりませんか?
    4G以上のメモリと残りストレージスペースが20G程度のPCやノートパソコンであれば構いません。

    授業内容を個人のブログや羽毛にまとめて公開してもいいですか?
    該当講義の羽毛に著作権表記がされています。

    ⚠️受講前確認してください。

    データ分析を学ぶと、証券市場で大きな収益を得ることができると期待される方
    この講義は証券投資の講義ではなく、データ分析の講義です

    インフラストラクチャのプレビューまたは知識共有者のYouTubeチャンネルを通じて公開されているいくつかの講義を最初に聞いて、受講するかどうかを決定してください。
    受講前にいくつかの講義をプレビューできます。希望の学習方向であることを確認してください。また、ご不明な点は受講前のお問い合わせを通じてお問い合わせください。

    📈証券データ収集と分析で信号とノイズを探す👉 http://bit.ly/inflearn-finace-data

    アーリーバード期間中30%割引予定です!

    ありがとうございます。

    0
  • todaycode님의 프로필 이미지

    こんにちは。

    最近💊コロナ19確定者が増加するにつれて、ソウル市で確定者の現状を明らかにする🚧技術的な方法が変更されました。

    だから、既存のパンダスのread_htmlでファイルを読み込もうとして慌てた方がたくさんいらっしゃるようです。

    明らかにソースコードを見ると、tableタグが見えますが、データはどこに行きましたか?

    サイトを運営してみると、このように様々な理由でサイトの構造が変更されるか、公開するデータが変更されることもあります

    もはや確認者が増えていないので、このようなアップデートよりはライブラリアップデートなどのアップデートをしてほしいです。

    そのため、変更された📚確認者のリストをインポートする付録コースを追加しました。

    該当付録講座は🐼パンダスの授業範囲外の内容なので、その内容を実習してみるかどうかについては選択をすればいいと思います。

    既存パンダスだけを使用してはデータをインポートできない形に変更となりました。

    そのため、requestsというライブラリを使用して、ブラウザのネットワークタブを介してどのようにデータが表示されるかについての原理を説明し、ページごとにデータを取得する方法についてのビデオを作成しました。

    短くしてみようと思ったのですが、必ず説明しなければならない内容だけを盛り込むべきだと思いましたが、10分ほどの映像が7つ作られました。

    🕸 データ収集方法ではなく、最近のデータだけ収集をしてみたいという方は、映像下部に提供してくれるソースコードを実行してみるだけでもデータを収集してみることができます。

    コロナ19が終了し、次のアップデートには最終に変更された内容の反映になってほしいです。

    また、⭐️別点5個⭐️の受講評はアップデートに最大の力となります。

    これからも着実に更新される講座になるように良い受講評をお願いいたします! 🙇‍♀️

    ありがとうございます。

    0
  • todaycode님의 프로필 이미지

    こんにちは。

    「たった2枚の文書でデータ分析と可視化ポッティング」講座を受講していただきありがとうございます!

    オンラインとオフラインの受講生の方々にPandas Cheat Sheetを紹介し、本当に2枚の文書だけでもパンダスの主な機能を学ぶことができることをお知らせしたくて講座を作ることになったのが一年を超えました。

    一年中多くの方がこの講座を受講していただきました。

    感謝の気持ちでパンダスを通じた分析コンテンツを追加しました。

    「公共データでPythonデータ分析を始める」を通じてプロジェクト形式でデータを分析してみることもできます。

    この講座にも同様のプロジェクトをしてみる授業があればいいと思い、現業に似たプロジェクト授業コンテンツを追加することになりました。

    各自治体でコロナ関連データを公開しています。

    ソウル市で公開しているコロナ19発生現況サイトをパンダスだけでクロールして分析するコンテンツを追加しました。

    該当講座では、6月までのソウル市で公開している確定者の現状データを分析します。

    たった2枚の文書で学んだ内容を、現業に似たプロジェクトで分析してみる

    ソウル市コロナ19発生現況サイトをクロールから前処理、分析、可視化までパンダスを活用して分析してみます。

    ニュース記事と日常を通してよく遭遇するデータを直接分析してみます。

    • 確信者が一番出てきた球はどこでしょうか?
    • どの病院で確信者を最も治療したのでしょうか?
    • 区別的に多く移送される病院はありますか?
    • 海外流入確定者が最も多く出てきた区はどこでしょうか?
    • 複数の国をヨーロッパ、南米などでテキスト前処理をするためにはどうすればいいですか?
    • 海外流入確定は月別にどの程度差が出るのでしょうか?

    パンダスによるデータの前処理方法を理解し、実践してみましょう。

    • テキストの日付から年、月、日、曜日、週はどうやって入手できますか?
    • 確定者の現状データで累積確定数はどのように求められますか?
    • groupby、crosstab、pivot、pivot_tableの違いはどのようになり、どの機能を使用するのに適していますか?

     

    データフレームとシリーズのデータ​​構造を理解し、分析に適した形に加工してみます。

    • Pandas の plot でグラフを描画するためのデータフレームの形はどのように作るべきでしょうか。
    • グラフ内のカテゴリー値によって異なる色で値を表現したい場合は、データフレームをどのように変更する必要がありますか?
    • シリーズをデータフレームに置き換えるにはどのような方法がありますか?

    コースで直接確認してください!

     

     

    過去1年間、多くの質問と良い受講評を残してくれたおかげで講義を更新することができました。

    今後も着実に講座を改善・更新する予定です。

    良い受講評を残していただければ、着実なコンテンツ改善に大きな力になります。

     

    コロナ19から抜け出し、また日常に戻ることを願っています!

    ありがとうございます。

    0

¥5,792