강의

멘토링

로드맵

Data Science

/

Data Analysis

[データ前処理] 心配しないで!Pandasがあるから。

データはあるけど、これをどうPythonで読み込んで処理すればいいか途方に暮れていますか?心配しないでください。Pandasの魔法で処理できます。Pandasは最も強力で、効率的で、有用なデータ処理ライブラリです。 Pandasでデータ前処理スキルアップ!インサイトたっぷり!

  • DataFactory
판다스
데이터분석
데이터분석실습
데이터처리
공공데이터
Python
Pandas
Data Engineering
data-science
data-processing

学習した受講者のレビュー

こんなことが学べます

  • 自分のキャリア全体を通して活用できるデータ処理技術

  • データ分析のための必須要素として広く定着したPandas!

  • データ結合、再構造化、欠損値処理、重複データ処理

  • テキストデータ、カテゴリ型データ、日付データを処理する

  • ダウンロード可能な教材(pdf)と実習ファイルを提供

📢この講義の利点

  • 単にPandasの機能だけをお知らせするものではありません。データの前処理を「なぜ」するのか、「いつ」するのか、「どのように」するのか、そして「どの基準」にするのかを文脈で理解し、自分で判断できるように説明します。

  • PCに何もインストールする必要なく、WebブラウザだけでGoogleコラボですぐにコーディング実習を行うことができます。

  • PDF教材ファイルとすぐに使える練習コードを提供します。

  • 実際のムービーIMDBデータセットを使用して前処理の実感を高めることができます。実際のデータで発生する可能性がある前処理の問題に遭遇し、トラブルシューティングの能力を高めることができます。

📌 Pandasを活用したデータ前処理(Preprocessing)

  • Pandasは、データの前処理に特化した強力で柔軟なPythonライブラリです。

  • データ前処理は、データ分析またはデータモデリングの前に生データを分析に適した形式に変換するための重要なプロセスです。

  • 欠測値、異常値、重複データを適切に処理することで、データの品質を向上させ、分析効率を向上させることができます。

  • テキストデータ、カテゴリデータ、時系列データを処理できます。

  • 詳細については講義で直接確認してください。 😄

📌データ前処理?こんな質問にお答えします!

  • データをファイルから読み込むときはどうすればよいですか?

  • DataFrameで特定の条件に合った行または列をどのように選択しますか?必要な基準でデータをフィルタリングまたはソートする方法はありますか?

  • 複数の DataFrame を結合またはマージする場合、merge() と concat() の違いと、それぞれどのような状況で使用するのが適切かを混乱させます。明確に説明できますか?

  • 欠測値を処理する効果的な方法は何ですか?どのような場合は削除し、どのような場合に置き換えますか?たとえば、特定の統計値に置き換える基準をどのように決めるのですか?

  • 異常値を検出する視覚的な方法に加えて、統計的な基準や関数を活用する方法がありますか?そして、検出された異常値を無条件に除去するのが最善ですか?

  • テキストデータを前処理するときは、「正規表現」が重要なのですが、それは何ですか?

  • カテゴリデータをどのように区別しますか? One-Hot EncodingとLabel Encoding - それぞれの方法はどのような場合に使用するのが良いでしょうか?

  • 時系列データを扱うとき、日付/時刻形式の変換に加えて、特に注意すべき前処理がありますか?たとえば、時間間隔の調整や移動平均の計算などを前処理に含めることができますか?

誰でも簡単にフォローして理解できるように、フレンドリーで詳細な練習コースを提供しています。

📌こんな方のためにご用意しました!


データ分析に入門したい方

データ分析業務に挑戦し、データ処理能力を強化したい入門者


基礎が足りないと感じる方

データ分析を始めたいがどこから始めるべきか


Pandasが初めての方

すでにデータ分析を勉強したことがありますが、パンダに慣れていないため、活用に困難がある方

🏅このプロセスを終えたら、何ができますか?

  • Pandasの基礎を習得することができます。

  • Pandasを活用するのに慣れておらず、一度にイライラした方も自信を持ってPandasを活用できます。

  • データの前処理技術を理解し、前処理段階で実行される主なタスクと技術を理解することができます。

🤔質問がありますか?

Q. Pythonをよく知らなくても川の受講は可能ですか?

Pythonの基本文法の程度は理解しておく必要があります。

Q. データの前処理を学ぶべき理由は何ですか?

「データ分析業務の8割がデータ前処理」という言葉があるほど、多くの時間をデータ前処理に注ぐことになります。実世界のデータ(raw data)は、「値がない、奇妙な値が入っている、フォーマットが合わない、...」のようなきれいなデータ(Clean data)が一つもありません。未精製のデータはデータ分析の結果を歪める可能性があります。したがって、データの前処理はデータ分析の重要なステップと呼ばれることがあります。

🛍受講前の注意

練習環境

  • 使用ツール:Google Colabatoryを使用してください。 GoogleアカウントとWebブラウザのみが必要です。


学習資料

  • PDF形式の学習教材を提供します。

  • 実習ファイル(.ipynb)、実習データなどを提供します。

選手の知識と注意事項

  • データ分析の入門者のためのプロセスとして、基本的なPython文法は熟知する必要があります。

  • すべての講義を順番に学習する必要はありません。 Pandasにある程度おなじみの方なら、必要な部分だけを選んで聞くこともできます。パンダスが初めなら初めからゆっくり学習してください。

Python, Pandas, data-science, data-analysis, data-cleaning

こんな方に
おすすめです

学習対象は
誰でしょう?

  • Pandasを使ったデータ前処理に飢えている方々

  • データ分析に入門する方々

前提知識、
必要でしょうか?

  • パイソン基礎

こんにちは
です。

  • 전산학 학사, 통계학 석사

  • 삼성디스플레이, 삼성 전자, 한국 오라클 교육센터, 멀티 캠퍼스, 에티버스러닝 등 다수의 기업체 강의 경력

  • Oracle 공인 강사, Oracle Cloud Infrastructure(OCI) 공인 강사

  • Google Cloud Authorized Trainer(GCP) 공인 강사

  • 데이터 분석, 데이터 시각화, 머신러닝, 딥러닝, Cloud, RDBMS 등 강의

     

カリキュラム

全体

24件 ∙ (6時間 43分)

講座資料(こうぎしりょう):

授業資料
講座掲載日: 
最終更新日: 

受講レビュー

全体

1件

5.0

1件の受講レビュー

  • sprun님의 프로필 이미지
    sprun

    受講レビュー 1

    平均評価 5.0

    修正済み

    5

    29% 受講後に作成

    파이썬 데이터 전처리 공부에 많은 도움이 되었습니다. 후속 강의도 마련되면 좋겠습니다. 기초부터 차근차근 잘 알려주셔서 감사합니다.

    • DataFactory
      知識共有者

      좋은 수강평 감사합니다.

¥5,290

似ている講座

同じ分野の他の講座を見てみましょう!