강의

멘토링

커뮤니티

BEST
Data Science

/

Data Engineering

本番データサイエンス Part2.データ前処理

ビジネス実践では、データナビゲーション(EDA)、データクリーニング、スケーリング、異常値処理、対数変換、カテゴリエンコーディングなどが必要な理由と、どのように対処する必要があるかを学びます。また、テーブルデータの結合、(非定型)時系列データの処理方法を学びます。

  • hjkim3
Python

学習した受講者のレビュー

受講後に得られること

  • データ分析と機械学習の最初のステップとして、1)データクリーニング、2)スケーリング、3)異常値処理、4)データ変換(ログ変換、カテゴリエンコーディング)の基本概念を学びます。

  • 本格的なデータ分析の前に、データの全体的な特性を調べて、収集したデータが分析に適しているかどうかを調べる探索的分析(EDA)方法を学びます。

  • テーブルデータ、時系列データ処理を学び、concat、join、merge、groupby、pivot_table、walk forward予測の概念を明確に理解します。

核心だけを入れた!
データ分析に必要なデータ前処理

ビッグデータ分析、機械学習、ディープラーニング、人工知能、デジタル変換(DT)など、最近最も需要が高い技術分野です。ほとんどすべての業界でこれらの技術を担当するデータサイエンティストの育成が、最も重要で緊急の状況です。

企業でデータを扱う実務家が最も時間を費やす必要があり、実際にデータ分析(機械学習)のパフォーマンスに最大の影響を与える業務がデータ前処理です。


📝コアデータ前処理

このレッスンでは、効果的なデータナビゲーション(EDA)方法、およびデータ前処理の4つの主要な内容であるデータクリーニング、スケーリング、異常値処理、データ変換の概念について説明します。


👩‍💻理論+実習講義の構成


タイタニックサバイバーを予測するには?


欠測値処理実習、テイター変換実習、線形分類予測など理論に基づいた実習を通じて、現業で必要なデータ分析をすぐに適用できるように支援します。


🙋‍♂️現場で必要なトピック

テーブルを扱う
時系列データ処理

実際には、テーブル構造データをさまざまな方法で組み合わせる作業が頻繁に必要です。 concat、append、join、merge、groupby、および pivot_table 関数の違いを理解し、どのような場合にどの関数が有用かを説明します。

また、実務で非定型データである時系列データを扱うことが多いです。 datetimeを利用する方法と順次時系列予測方法であるwalk forward予測を説明し、線形モデルを用いたバイナリ分類および回帰予測モデルを紹介します。


📕川の特徴

  • すべての内容は実践コードで説明されています。

実習コードショートカット👉 https://github.com/data-labs/preprocessing

  • サンプルコードは、あなたがビジネスですぐに活用できるように設定しました。
  • コードは簡潔ですが、重要な内容が含まれており、使いやすく書かれています。

👩‍💻コアデータサイエンス

データサイエンスの基礎となる言語Python。
本講義はPythonの基礎知識が選ばれる講義です。
Python言語の基礎知識がない人は
本番データサイエンス Part1. Python入門講義を通じて
選手の知識学習をおすすめします。

こんな方に
おすすめです

学習対象は
誰でしょう?

  • データの前処理は、データ分析のパフォーマンスに影響を与える最も重要なプロセスです。

  • テーブル構造データを付ける作業、時系列データを扱う基本概念を理解し、現業ですぐに活用したい方におすすめです。

前提知識、
必要でしょうか?

  • Pythonの基本的な知識が必要です。

こんにちは
です。

921

受講生

78

受講レビュー

11

回答

4.8

講座評価

3

講座

"고장난 라디오 고칠 수 있어?"

제가 전자공학과에 입학한 후 친구로부터 받은 질문입니다. 뭐, 대답은 했습니다. "전자공학과에서는 라디오 만드는 원리를 배우는 것이지 고장난 전자제품 고치는 것은 우리 일이 아니고..." 

이론으로 무장한 전문가보다 문제 해결사가 필요한 경우가 더 많습니다. 저는 실전 문제 해결이 더 중요하다고 생각합니다.

최근에는 머신러닝으로 금융, 에너지, 전자, 중장비, 물류, 신약개발, 식품 등 산업 영역의 문제를 해결하는 일을 하고 있는데, 정말 배울 것도 많고 할 일도 무궁무진한 영역인 것 같습니다. 본업은 교수지만 (강원대 컴퓨터공학과), 현장의 문제해결에 관심이 많아 여러 겸직을 하고 있습니다. AI신약개발지원센터장, KAIST 겸임교수, 그리고 데이터사이언스랩 대표를 맡고 있습니다.

AI 시대에 가장 필요한 인재는 실전 문제를 해결할 수 있는 데이터 사이언티스트라고 믿으며 여러분 모두  인기 있는 데이터 사이언티스트가 되기를 바랍니다.

カリキュラム

全体

19件 ∙ (4時間 13分)

講座掲載日: 
最終更新日: 

受講レビュー

全体

18件

4.7

18件の受講レビュー

  • dfeafe님의 프로필 이미지
    dfeafe

    受講レビュー 8

    平均評価 4.9

    4

    100% 受講後に作成

    Tôi thích nó vì nó từng bước một và cơ bản, giống như một lớp học ở trường.

    • hjkim3
      知識共有者

      Đúng là nó được tiến hành như một lớp học. Tôi hy vọng bạn sẽ đạt được kết quả tốt.

  • victory1791791577님의 프로필 이미지
    victory1791791577

    受講レビュー 5

    平均評価 4.6

    5

    100% 受講後に作成

    Luôn luôn giải thích tử tế và bình tĩnh để dễ hiểu. Cảm ơn!

    • hjkim3
      知識共有者

      Cảm ơn bạn đã đánh giá tốt.

  • sungkenh0540님의 프로필 이미지
    sungkenh0540

    受講レビュー 2

    平均評価 5.0

    5

    100% 受講後に作成

    Nó rất hữu ích trong việc nghiên cứu tiền xử lý dữ liệu Python. Tôi thích các phương pháp khác nhau cần thiết để xử lý trước dữ liệu và thực hành sử dụng dữ liệu thực.

    • hjkim3
      知識共有者

      Cảm ơn bạn đã đánh giá tốt.

  • alcatraz761636님의 프로필 이미지
    alcatraz761636

    受講レビュー 2

    平均評価 5.0

    5

    100% 受講後に作成

    Cá nhân tôi đánh giá đây là một bài giảng rất hay và xuất sắc. Trước đây tôi đã học Phần 1 và mặc dù có một số phần mà nội dung hơi khó khi khóa học diễn ra nhưng tôi có thể hiểu nó mà không gặp vấn đề gì.

    • hjkim3
      知識共有者

      Tôi rất vui vì bạn đã tự mình tìm ra nó. Hãy hỏi bất kỳ câu hỏi nào bạn có ~

  • quber02012351님의 프로필 이미지
    quber02012351

    受講レビュー 3

    平均評価 3.0

    3

    100% 受講後に作成

    Tôi thực sự rất thích bài giảng. Tôi nghĩ rằng tôi đã hiểu cốt lõi của quá trình xử lý trước dữ liệu trong 5 giờ. Cảm ơn !

    • hjkim3
      知識共有者

      Đặc điểm của nó là có thể được tổ chức trong thời gian ngắn. Cảm ơn bạn đã đánh giá của bạn!

¥6,838

hjkim3の他の講座

知識共有者の他の講座を見てみましょう!

似ている講座

同じ分野の他の講座を見てみましょう!