Pixart & SANA、実装しながら学ぶDiffusion完全攻略 III
Sotaaz
最新のTransformerベースのPixArtと軽量適応化SANAを理論からコードまで段階的に実装します。I・II編で扱ったDDPM・DDIM・LDM・DiTを基に、テキストエンコーダ接続、サンプラー(DDIM/ODE)、v-予測/CFGチューニング、小規模データスタイル微調整まで実習中心で完走します。
Intermediate
Python, PyTorch, AI
2025年、ジェンソン・フアンが直接言及したPhysical AI、 Perception AI、Generative AI、Agentic AI、そしてPhysical AIの時代が来る。 速く簡単にPhysical AIを直接体験してみます。 HuggingFaceのLeRobotライブラリと実物ロボットと共にPhysical AIを体験してみてください。
LeRobotライブラリを使ってみる
SO-ARMで多様なVLAを体験する
片腕ロボット、双腕ロボット、モバイルマニピュレータロボットで様々なVLAを使ってみる
HuggingFaceが公開したLeRobotライブラリを通じて、様々なVLAモデルを実行することができます。
論文で公開された技術をロボットがなくて実装できない場合が多いです。
安価なロボットアームを使ってLeRobotライブラリを体験してみましょう。
LeRobotライブラリを学び、様々なVLAモデルを実行するためには実際のロボットが必要です。最も安価なSO-ARMロボットを使用します。
このロボットを動作させるためのロボットセッティング方法を学びます。
Pythonで構成されたこのライブラリを見ていきましょう。
LeRobot
最も基礎的で素早く実装できるACTについて学びます。
そして直接実行してみます。実際のPhysical AIを最も速く体験できるモデルです。
オペレーティングシステムおよびバージョン(OS): Windows、macOS、Linux、Ubuntu、Android、iOSなどのOS種類およびバージョン
使用ツール: 実習に必要なソフトウェア/ハードウェアのバージョンおよび課金プラン、仮想マシンの使用有無など
PCスペック:CPU、メモリ、ディスク、グラフィックカードなど、プログラム動作のための推奨スペックなど
提供する学習資料の形式(PPT、クラウドリンク、テキスト、ソースコード、アセット、プログラム、例題問題など)
分量及び容量、その他学習資料に関する特徴及び留意事項など
学習難易度を考慮した必須の事前知識の有無
講義映像の品質(音質/画質)など受講に直接関連する内容及び推奨学習方法
質問/回答および今後のアップデート関連内容
講義及び学習資料の著作権に関するお知らせ
学習対象は
誰でしょう?
AI分野からPhysical AI、ロボット分野に移りたい方
VLA(Vision-Language-Action)モデルに興味がある方
全体
12件 ∙ (1時間 3分)
期間限定セール
¥6,800
49%
¥13,425
同じ分野の他の講座を見てみましょう!