inflearn logo
知識共有
inflearn logo

Spark機械学習完全ガイド - Part 1

Spark(スパーク)機械学習の核心フレームワークに対する理解、難易度の高い実戦問題を通じたSQLベースのデータ加工、業務ドメイン分析を通じたデータ分析と最適化された機械学習モデルの構築能力まで、大容量データに基づいた機械学習のエキスパートとして認められたいなら、この講義と共に歩んでください。

難易度 中級以上

受講期間 無制限

Apache Spark
Apache Spark
Machine Learning(ML)
Machine Learning(ML)
Big Data
Big Data
Data Engineering
Data Engineering
Apache Spark
Apache Spark
Machine Learning(ML)
Machine Learning(ML)
Big Data
Big Data
Data Engineering
Data Engineering

学習した受講者のレビュー

学習した受講者のレビュー

4.9

5.0

freedom07

93% 受講後に作成

Pythonマシンラーニング完璧ガイドを通してクォンチョルミン先生を初めて知りました。その講義を通して非専攻者だった私は、あきらめようとしたこの分野をあきらめないことができました。 現在、この分野で仕事をしながらこのようにインフラ講義を聞き、勉強も着実にしています。 先生に感謝するというお言葉を伝えたくて、最初に質問回答事案に先生に感謝しているとおっしゃいましたが、先生が着実にすれば努力したことを成し遂げられると応援しながらおっしゃっていただきました。 今後も先生が講義することを着実に聞く予定です。 ^^ㅎㅎそれほど本当に教えてくれます。 クォンチョルミン先生この席を借りて、心から本当にありがとうございます。

5.0

egs41

10% 受講後に作成

講師の辞書や声に集中するのが良かったし、コンテンツもしっかりしています。これからも良い講義を作ってください。ありがとうございます。

5.0

밑바닥개발자

54% 受講後に作成

クォンチョルミンの講義シリーズをずっと入ってきた受講生です!それでも質の高い講義を提供してくれてありがとう!そして、Spark講義がScala、Javaで構成された講義を何度も見ましたが、PythonでSparkを教えてくれる講義は初めてだったので良かったようですね!まだ頑張っていませんが、まだ簡単な文法もできるだけ簡単に教えてあげたいのが一番ですね!そして、繰り返し熟達を誘導するために様々な実習資料を提供していただくのも良いです!これから他の講義も期待になります!

受講後に得られること

  • Sparkで機械学習モデルを実装する

  • Sparkのデータ処理の基盤であるDataFrameに関する詳細な理解

  • Spark機械学習フレームワークを構成する多様な技術要素の理解

  • Sparkの機械学習パイプラインを習得する

  • データ分析のためのSQL活用能力

  • SQLベースのFeature Engineering手法

  • SparkでXGBoostとLightGBMを使用してモデルを実装する

  • ベイズ最適化に基づいたモデルのハイパーパラメータチューニング手法

  • 難易度の高い実戦問題を通じて、データ分析とMLモデルの実装スキルを同時に向上

  • 分析ドメインに基づいたデータ分析手法

  • 様々なデータ可視化手法

[お知らせ] 本講義の実習環境としてクラウドベースで無料提供されていたDatabricks Community Editionは、現在新規登録ができません。そのため、実習環境は2025年12月5日を基準にローカルのSparkおよびJupyter環境へと変更されることをお知らせいたします。

ローカル環境への変更に伴う実習コードの変更は一部分に限定されているため、セクション1からセクション10に該当するほとんどの講義映像は、Databricks Communityで既存の録画映像がそのまま使用されており、主要な変更事項のみローカルSparkでの実習映像として新しく講義が構成されました。セクション11からはローカルSparkでの実習映像に多くの講義が変更されました。

現在の講義は、Databricks Communityベースの既存の録画映像と、ローカルSparkベースの新規映像が混在して構成されていますので、講義選択の際にご参照ください。

 

データ分析 + フィーチャーエンジニアリング + ML実装、
3つのスキルを一度に手に入れましょう。

Apache Sparkと
機械学習の出会い。

オープンソースの大容量分散処理ソリューションの最強者であるApache Spark(アパチスパーク)Machine Learningが出会いました。

国内の多くの大企業や金融機関で、Apache Sparkを活用して大容量データを分析し、機械学習モデルを作成しています。Sparkは分散データ処理フレームワークをベースにしているため、少なければ数台から多ければ数十台のサーバー上で容量を拡張しながら、大容量データの処理やMLモデルの作成が可能です。そのため、1台のサーバーでしか機械学習モデルの実装ができないScikit-learnの限界を超えることができます。


データ加工・分析にも長けた
機械学習のエキスパートへと
成長させます。

「Spark機械学習完全ガイド - Part 1」講座は、Sparkで機械学習モデルを実装する方法を習得するだけでなく、データ加工や分析にも長けた機械学習エキスパートへと皆様を成長させてくれるでしょう。

真の機械学習エキスパートとして成長するためには、単にMLの実装能力だけでなく、業務データをどのように加工・組み合わせてMLモデルを作り上げるかという能力も非常に重要です。そのために、実務で大容量データの処理に最も多く使用されるSQLを活用してデータを加工する方法と、業務ドメイン分析に基づいたデータ分析手法を実習を通して習得していただきます。

詳細な理論説明と実習を通じて、データ加工・分析およびML実装能力を養えるよう構成しました。


皆さんが直面する問題を
解決いたします。

Sparkベースで機械学習モデルを実装するのは容易ではありません。それは、Sparkアーキテクチャの特殊性に基づいた独特な機械学習APIやフレームワーク、そしてSQLに基づいたデータ処理など、既存のデータサイエンティストや機械学習の専門家が経験したことのない多くの問題に直面するためです。

本講義、「Spark機械学習完全ガイド」を通じて、皆さんが直面している問題を解決する能力を養います。

'スパーク機械学習完全ガイド - Part 1' 講義前半部

講義の前半部は、スパークMachine Learning Frameworkを構成する多様な要素であるDataFrame、SQL、Estimator、Transformer、Pipeline、Evaluatorなどについて、詳細な理論説明と豊富な実習で構成されています。これを通じて、皆さんはSparkでMLモデルを簡単かつ迅速に実装できるようになるでしょう。.

また、SparkでLightGBMを使用する方法、ベイズ最適化に基づいたHyperOptを利用してハイパーパラメータをチューニングする方法について詳しく説明します。

「Spark機械学習完全ガイド - Part 1」講義の後半部

講義の後半は、KaggleのInstacart Market Basket Analysisコンペティションの実習で構成されています。

難易度の高いコンペティションであるKaggleのInstacart Market Basket Analysisコンペティションのモデル実装を通じて皆さんの実践的なデータ加工・分析能力と機械学習モデルの実装能力を同時に向上させます。

該当データセットを通じて、SQLベースで業務データをどのように加工・分析し、フィーチャーエンジニアリング(Feature Engineering)を行うのか、また業務において分析ドメインをどのように導き出すのか、そしてこのように導き出されたフィーチャーに基づいてどのようにモデルを生成するのかについて、詳細に学ぶことになります。

💻 受講前にご確認ください!

  • 本講義の実習コードはすべてPythonベースとなっています。Scalaは扱いませんので、講義選択前にご確認をお願いいたします。

実習環境を
ご確認ください。

本講義はDockerを活用し、ローカルSparkとJupyterベースで実習環境を構成します。ローカルPCにDocker Desktopをインストールして実習環境を構築しますが、Dockerをご存じなくても実習環境の構築に全く問題がないよう講義を構成いたしました。

講義の実習コードと講義の説明資料は、'실습코드와 설명자료 다운로드 받기'からダウンロードいただけます。


事前知識が
必要な講義です。

本講義は、受講生の皆様が「Python機械学習完璧ガイド」の第5章(回帰)またはそれに準ずる知識をお持ちであること、またSQLに関する非常に基本的な部分を理解されていることを前提に構成されています。講義を選択される際は、上記の事項をご参照ください。

Sparkは基本的な部分をご存知であればより良いですが、知らなくても講義を進める上で問題はありません。

受講前に必要な知識を確認してください!

Python機械学習パーフェクトガイド

理論中心の機械学習講義はもう終わり、
機械学習の核心概念から実践的な能力まで、分かりやすく正確に。

知識共有者のインタビューが気になるなら? (クリック)

こんな方に
おすすめです

学習対象は
誰でしょう?

  • Sparkを利用して機械学習を実装しようとしている方

  • 大容量データに基づいて機械学習を実装したい方

  • SQLを利用して機械学習のためのデータ処理技術を向上させたい方

  • 実践で望む形にデータを加工し、それに基づいてMLモデルを生成する全過程を習得したい方

  • データ分析とフィーチャーエンジニアリング能力、そしてMLの実装を共に向上させたい方

前提知識、
必要でしょうか?

  • 『Python機械学習完璧ガイド』の第5章(回帰)まで理解している、またはそれに準ずる予備知識

  • SQLの基本理解

こんにちは
dooleyz3525です。

27,852

受講生

1,498

受講レビュー

4,067

回答

4.9

講座評価

15

講座

(元) エンコアコンサルティング | (元) 日本オラクル | 『Python機械学習完璧ガイド』著者

AIフリーランスコンサルタント

 

カリキュラム

全体

132件 ∙ (25時間 1分)

講座資料(こうぎしりょう):

授業資料
講座掲載日: 
最終更新日: 

受講レビュー

全体

29件

4.9

29件の受講レビュー

  • egs41님의 프로필 이미지
    egs41

    受講レビュー 54

    平均評価 5.0

    5

    10% 受講後に作成

    講師の辞書や声に集中するのが良かったし、コンテンツもしっかりしています。これからも良い講義を作ってください。ありがとうございます。

    • iamcodingcat님의 프로필 이미지
      iamcodingcat

      受講レビュー 13

      平均評価 5.0

      5

      54% 受講後に作成

      クォンチョルミンの講義シリーズをずっと入ってきた受講生です!それでも質の高い講義を提供してくれてありがとう!そして、Spark講義がScala、Javaで構成された講義を何度も見ましたが、PythonでSparkを教えてくれる講義は初めてだったので良かったようですね!まだ頑張っていませんが、まだ簡単な文法もできるだけ簡単に教えてあげたいのが一番ですね!そして、繰り返し熟達を誘導するために様々な実習資料を提供していただくのも良いです!これから他の講義も期待になります!

      • indizz4933님의 프로필 이미지
        indizz4933

        受講レビュー 1

        平均評価 5.0

        5

        100% 受講後に作成

        冷静に教えてくれてありがとう。

        • freedom07님의 프로필 이미지
          freedom07

          受講レビュー 7

          平均評価 5.0

          5

          93% 受講後に作成

          Pythonマシンラーニング完璧ガイドを通してクォンチョルミン先生を初めて知りました。その講義を通して非専攻者だった私は、あきらめようとしたこの分野をあきらめないことができました。 現在、この分野で仕事をしながらこのようにインフラ講義を聞き、勉強も着実にしています。 先生に感謝するというお言葉を伝えたくて、最初に質問回答事案に先生に感謝しているとおっしゃいましたが、先生が着実にすれば努力したことを成し遂げられると応援しながらおっしゃっていただきました。 今後も先生が講義することを着実に聞く予定です。 ^^ㅎㅎそれほど本当に教えてくれます。 クォンチョルミン先生この席を借りて、心から本当にありがとうございます。

          • dooleyz3525
            知識共有者

            こんなに胸のムククルの受講評を残してくださると私がもっと感銘を受けました。 講義を作る手間を一瞬にして報われる文章なので、私はむしろ感謝しなければならないようです。これからもずっとこのように精進していけば、望むすべてのこと確実にすべて成就します。ありがとうございます。

        • gomjong님의 프로필 이미지
          gomjong

          受講レビュー 8

          平均評価 4.9

          5

          100% 受講後に作成

          おかげでスパークについて知りました。

          dooleyz3525の他の講座

          知識共有者の他の講座を見てみましょう!

          似ている講座

          同じ分野の他の講座を見てみましょう!

          ¥12,646