GPT APIを活用したYouTube動画要約AIの作り方
Essential
複雑なGPT APIとPythonを、最も簡単に実習中心で習得することを目指します。 最新のChatGPT APIを活用してYouTube動画要約AIを開発し、それをStreamlitで構成してウェブアプリケーション形式で実装します。
Basic
Python, Big Data, AI
本講義は、Node.jsとTypeScript環境で最新のGemini API SDK(@google/genai)を扱うことを目標としています。 テキスト、画像、ビデオを同時に処理するマルチモーダル技術の使用方法を学びます。 APIキーの発行からプロジェクトの設定、モデルの呼び出しまで、全過程を実習します。
4名 が受講中です。
難易度 入門
受講期間 無制限
TypeScript + Gemini API の使い方
テキスト生成 (Config設定、マルチモーダル、ストリーミング、マルチターン、Tool、Function call、コード実行、スキーマ出力)
画像生成 (Text to Image, Image to Image, Image with Tool)
最新のGemini API SDKをNode.jsとTypeScript環境で自在に操り、
マルチモーダルAI技術を実際のサービスに適用できる開発者へと成長します。
最新のLLM技術を実際のサービスに適用したいけれど、
どのAPIをどのように活用すべきか分からず困っていませんか?
テキスト、画像を超えてビデオまで一度に処理する
Geminiの強力なマルチモーダル機能を直接実装してみたいですか?
ChatGPTを超えてGemini APIを活用する方法を学んでみたいですか?
この講座を通じてGemini APIを完璧にマスターし、
AIベースの革新的なサービスを自ら作り上げることができます。
実務サービス開発にすぐ適用可能なAI活用能力を養い、
最新のLLM技術をリードする開発者へと成長してください。
TypeScriptとGemini APIの活用能力を即座に習得します。
Node.jsとTypeScript環境で最新のGemini API SDKを熟練した技術で扱う方法を学びます。APIキーの発行からプロジェクトの設定、マルチモーダルデータの処理、多様なテキストおよび画像生成機能まで、講義で提示する実習を通じて実務で即座に適用可能な技術スタックを完成させます。
マルチモーダルAIサービスを自ら企画し、実装することができます。
テキスト、画像、ビデオなど、さまざまな形式のデータを同時に処理するGemini APIのマルチモーダル機能を活用し、より進化したAIサービスを自ら構築することになります。ストリーミング、マルチターン対話、関数呼び出し(Function Calling)などの高度な機能を自在に活用し、クリエイティブなサービスの実装能力を身につけることができます。
Gemini APIの核となる機能を正確に理解します。
Gemini APIのテキスト生成、画像生成(Text to Image、Image to Image)といった主要機能を、詳細な例題を通して習得します。各機能の設定方法や活用時の考慮事項を明確に理解し、どのような状況でも最適なAIモデルを選択して活用できる眼養いを養います。
AI技術の導入に対する自信を深め、専門家として成長します。
複雑に感じていた最新のAI技術を、分かりやすく体系的に学習することで自信を深めます。Gemini APIを活用したサービス構築の経験を通じて、AI開発者としてのスキルを強化し、実際のサービス開発過程で直面する様々な課題に対して、自ら解決策を見出す能力を身につけます。
本講의는 Node.js 및 TypeScript 環境で 最新の Gemini API SDK を活用する方法を重点的に扱います。テキスト、画像、ビデオを横断する マルチモーダル技術を、APIキーの発行から実際のモデル呼び出しまで、全過程にわたる実習を通じて習得できます。
Gemini APIを使用してテキスト生成、画像生成(Text to Image, Image to Image)など、多様な機能を直接実装します。Node.jsとTypeScriptをベースにマルチモーダルデータを処理し、Googleの最新AI技術を実務サービスに適用する経験を積むことができます。
講義では @google/genai ライブラリを使用して Gemini API を連携します。プログラミング環境の設定から API 呼び出し、レスポンス処理まで、すべての過程を直接コードで作成し、学習した内容をすぐに適用できる実習環境を提供します。
TypeScriptとGemini APIを活用して
マルチモーダルAIサービスを構築したいが、API連携やプロジェクト設定に苦戦している開発者
テキストだけでなく、画像やビデオなど、さまざまな形式のデータを処理する
最新のGemini APIのマルチモーダル機能を理解し、実際のサービスに適用する方法を模索している企画者
既存のTypeScriptプロジェクトに
Gemini APIを連携して、チャットボットや画像分析などのAI機能を追加したいが、バックエンド連携の経験が不足している開発者
実習環境
OS: Windows
開発ツール: Node.js (最新LTSバージョン推奨), Visual Studio Code (またはお好みのIDE)
事前知識および注意事項
JavaScriptおよびTypeScriptの基本文法の理解が必要です。
Node.js環境でのプロジェクト設定経験があると望ましいです。
APIキーの発行およびセキュリティ管理に留意する必要があります。
学習資料
Gemini API 公式ドキュメントおよびサンプルコード
学習対象は
誰でしょう?
TypeScript環境で最新のLLM技術を適用した実務サービスを構築しようとしている開発者
画像、ビデオ、オーディオなどのマルチモーダルデータを扱おうとするエンジニア
前提知識、
必要でしょうか?
TypeScript/JavaScript 基礎文法
275
受講生
41
受講レビュー
1
回答
4.8
講座評価
9
講座
プログラミングの核心と本質を簡単に理解できるように
体系的なカリキュラムと概念の整理を提供し、
PythonやJavaScript、Kotlinなど、さまざまなプログラミング言語と
React、Spring、FastAPIなどのフレームワーク技術
LangChain、n8nといったAI技術を親切に教えます。
実用的な例と実務への適用方法を案内します。
効率的な学習のために必要な内容だけを厳選し、素早く理解して活用できる講義を提供します。
全体
5件 ∙ (44分)
3. テキスト生成 - 1
10:30
4. テキスト生成 - 2
15:10
5. 画像を生成する
07:22
期間限定セール、あと6日日で終了
¥14,520
40%
¥3,028
知識共有者の他の講座を見てみましょう!
同じ分野の他の講座を見てみましょう!