강의

멘토링

커뮤니티

BEST
Data Science

/

Data Engineering

本番データサイエンス Part2.データ前処理

ビジネス実践では、データナビゲーション(EDA)、データクリーニング、スケーリング、異常値処理、対数変換、カテゴリエンコーディングなどが必要な理由と、どのように対処する必要があるかを学びます。また、テーブルデータの結合、(非定型)時系列データの処理方法を学びます。

  • hjkim3
Python

学習した受講者のレビュー

こんなことが学べます

  • データ分析と機械学習の最初のステップとして、1)データクリーニング、2)スケーリング、3)異常値処理、4)データ変換(ログ変換、カテゴリエンコーディング)の基本概念を学びます。

  • 本格的なデータ分析の前に、データの全体的な特性を調べて、収集したデータが分析に適しているかどうかを調べる探索的分析(EDA)方法を学びます。

  • テーブルデータ、時系列データ処理を学び、concat、join、merge、groupby、pivot_table、walk forward予測の概念を明確に理解します。

核心だけを入れた!
データ分析に必要なデータ前処理

ビッグデータ分析、機械学習、ディープラーニング、人工知能、デジタル変換(DT)など、最近最も需要が高い技術分野です。ほとんどすべての業界でこれらの技術を担当するデータサイエンティストの育成が、最も重要で緊急の状況です。

企業でデータを扱う実務家が最も時間を費やす必要があり、実際にデータ分析(機械学習)のパフォーマンスに最大の影響を与える業務がデータ前処理です。


📝コアデータ前処理

このレッスンでは、効果的なデータナビゲーション(EDA)方法、およびデータ前処理の4つの主要な内容であるデータクリーニング、スケーリング、異常値処理、データ変換の概念について説明します。


👩‍💻理論+実習講義の構成


タイタニックサバイバーを予測するには?


欠測値処理実習、テイター変換実習、線形分類予測など理論に基づいた実習を通じて、現業で必要なデータ分析をすぐに適用できるように支援します。


🙋‍♂️現場で必要なトピック

テーブルを扱う
時系列データ処理

実際には、テーブル構造データをさまざまな方法で組み合わせる作業が頻繁に必要です。 concat、append、join、merge、groupby、および pivot_table 関数の違いを理解し、どのような場合にどの関数が有用かを説明します。

また、実務で非定型データである時系列データを扱うことが多いです。 datetimeを利用する方法と順次時系列予測方法であるwalk forward予測を説明し、線形モデルを用いたバイナリ分類および回帰予測モデルを紹介します。


📕川の特徴

  • すべての内容は実践コードで説明されています。

実習コードショートカット👉 https://github.com/data-labs/preprocessing

  • サンプルコードは、あなたがビジネスですぐに活用できるように設定しました。
  • コードは簡潔ですが、重要な内容が含まれており、使いやすく書かれています。

👩‍💻コアデータサイエンス

データサイエンスの基礎となる言語Python。
本講義はPythonの基礎知識が選ばれる講義です。
Python言語の基礎知識がない人は
本番データサイエンス Part1. Python入門講義を通じて
選手の知識学習をおすすめします。

こんな方に
おすすめです

学習対象は
誰でしょう?

  • データの前処理は、データ分析のパフォーマンスに影響を与える最も重要なプロセスです。

  • テーブル構造データを付ける作業、時系列データを扱う基本概念を理解し、現業ですぐに活用したい方におすすめです。

前提知識、
必要でしょうか?

  • Pythonの基本的な知識が必要です。

こんにちは
です。

921

受講生

77

受講レビュー

11

回答

4.8

講座評価

3

講座

"고장난 라디오 고칠 수 있어?"

제가 전자공학과에 입학한 후 친구로부터 받은 질문입니다. 뭐, 대답은 했습니다. "전자공학과에서는 라디오 만드는 원리를 배우는 것이지 고장난 전자제품 고치는 것은 우리 일이 아니고..." 

이론으로 무장한 전문가보다 문제 해결사가 필요한 경우가 더 많습니다. 저는 실전 문제 해결이 더 중요하다고 생각합니다.

최근에는 머신러닝으로 금융, 에너지, 전자, 중장비, 물류, 신약개발, 식품 등 산업 영역의 문제를 해결하는 일을 하고 있는데, 정말 배울 것도 많고 할 일도 무궁무진한 영역인 것 같습니다. 본업은 교수지만 (강원대 컴퓨터공학과), 현장의 문제해결에 관심이 많아 여러 겸직을 하고 있습니다. AI신약개발지원센터장, KAIST 겸임교수, 그리고 데이터사이언스랩 대표를 맡고 있습니다.

AI 시대에 가장 필요한 인재는 실전 문제를 해결할 수 있는 데이터 사이언티스트라고 믿으며 여러분 모두  인기 있는 데이터 사이언티스트가 되기를 바랍니다.

カリキュラム

全体

19件 ∙ (4時間 13分)

講座掲載日: 
最終更新日: 

受講レビュー

全体

17件

4.8

17件の受講レビュー

  • dfiejf님의 프로필 이미지
    dfiejf

    受講レビュー 8

    平均評価 4.9

    4

    100% 受講後に作成

    학교 수업같이 차근차근하고 기초적이여서 좋습니다.

    • 김화종
      知識共有者

      수업처럼 진행한 것이 맞습니다.좋은 성과 얻으시기 바랍니다.

  • 허룡님의 프로필 이미지
    허룡

    受講レビュー 5

    平均評価 4.6

    5

    100% 受講後に作成

    항상 친절하고 차분한 설명 때문에 이해가 잘됩니다. 감사합니다!

    • 김화종
      知識共有者

      좋은평 감사합니다.

  • 홍성은 (sungkenh)님의 프로필 이미지
    홍성은 (sungkenh)

    受講レビュー 2

    平均評価 5.0

    5

    100% 受講後に作成

    파이썬 데이터 전처리 공부에 많은 도움이 되었습니다. 데이터 전처리에 필요한 다양한 방법론과 실제 데이터를 사용한 실습이 좋았습니다.

    • 김화종
      知識共有者

      좋은 평가 감사합니다.

  • alcatraz76님의 프로필 이미지
    alcatraz76

    受講レビュー 2

    平均評価 5.0

    5

    100% 受講後に作成

    개인적으로 매우 깔끔하고 훌륭한 강의라고 생각됩니다. 이전 Part1도 수강하였는데, 강의 진도상 내용이 조금 어려워진 부분은 있으나 문제없이 이해 할 수 있었습니다.

    • 김화종
      知識共有者

      스스로 해결하셨다니 다행입니다. 궁금한 내용은 질문해주세요~

  • quber0201님의 프로필 이미지
    quber0201

    受講レビュー 3

    平均評価 3.0

    3

    100% 受講後に作成

    정말 좋은 강의를 잘 들었습니다. 5시간 만에 데이타 전처리에 대한 핵심을 이해한 것 같습니다. 감사합니다 !

    • 김화종
      知識共有者

      짧은 시간에 정리한다는 것이 특징입니다. 수강평 감사합니다!

¥6,794

hjkim3の他の講座

知識共有者の他の講座を見てみましょう!

似ている講座

同じ分野の他の講座を見てみましょう!