安定的なAIエージェントサービス運用のための評価（Evaluation）手法

Name: 安定的なAIエージェントサービス運用のための評価（Evaluation）手法
Price: 69300 KRW
Rating: 4.8 (13 reviews)

AIエージェント、デプロイするたびに不安を感じていませんか？国内の大手企業や海外のビッグテックでの経験をもとに、LangSmithを活用してエージェントの品質を体系的に測定し、改善する方法をお伝えします。

（4.8）受講レビュー 13件

受講生 192名

難易度 中級以上

受講期間 無制限

jasonkang

Python

LangChain

LangGraph

Python

LangChain

LangGraph

学習した受講者のレビュー

4.8

5.0

이성규

33% 受講後に作成

いつも信頼して受講しているジェイスンさんの講義です。講師のLangchain関連の講義はすべて受講しており、そのおかげで現在はジュニアAIエンジニアとして業務を行っています。実務で評価に関して色々と悩んでいたのですが、ちょうど良いタイミングで講義が公開されたので、早速学習して適用しようとしています。いつも質の高い講義を提供してくださり、ありがとうございます。追加で別件の質問なのですが、今回本を出版されたことを今さら知りました。まだ本は購入していないのですが、講義をすべて受講した状態でも、本で学習する価値があるかどうかお伺いしたいです。いつも受講生の立場に立って説明し共有してくださるので、良い先輩（サス）のような安心感がある講義です。改めて、いつも素晴らしい講義をありがとうございます。 :)

5.0

Kyungbin Choi

100% 受講後に作成

最近のように新しいものが次々と溢れ出る状況の中で、エージェントの信頼性と品質について悩んでいたところ、質の高い講義を聴くことができ、大変助かりました。また次回も、面白くて有益な講義を期待しています。ありがとうございました。

5.0

미르

100% 受講後に作成

講義ありがとうございました。 LangChainからLangGraphまで、講師の方の講義で多くのことを学びました。次の講義も楽しみにしています。

受講後に得られること

AIエージェント特化型の評価手法と実務ノウハウ
"勘"ではなく"データ"に基づいた意思決定体系の構築
開発およびテストコストの画期的な削減
実際のサービス運用時に発生するエラー解決およびデバッグ技術

受講前のご注意事項

実習環境

Python 3.13 以上のバージョンのインストールが必要です。

前提知識および注意事項

Pythonプログラミングの基本文法に習熟している必要があります。
LangChain + LangGraphを活用したエージェント開発の経験がある方に適しています。
- LangChainの文法に慣れていない方は、まず1時間で終わらせるLangChainの基本↗️ を受講してください。
- LangGraphの文法に慣れていない方は、まずLangGraphを活用したAI Agent開発↗️を先に受講してください

学習資料

講義資料がNotionページ↗️で提供されます
実習コードおよび例題データセットは GitHub↗️ を通じて提供されます

こんな方に
おすすめです

学習対象は
誰でしょう？

プロンプトを一行直すたびに、他の機能が壊れるのではないかと不安になる開発者
開発チームとコミュニケーションをとる際、「感覚」ではなくデータと指標に基づいて意思決定を行いたい企画者
基礎を超えて実務レベルのAIエージェントを開発したい開発者

前提知識、
必要でしょうか？

Python必須
LangGraph 必須

こんにちは
jasonkangです。

インフラン認証

キャリア認証

19,645

受講生

1,588

受講レビュー

537

回答

4.9

講座評価

講座

FAANG シニアソフトウェアエンジニア
(元) AIエージェントプラットフォーム開発 & 運用、GSグループ
（元）メンター/コーチ、GSグループ DXブートキャンプ
(元) シリーズCのAIスタートアップにてテックリード
スタンフォード大学 Code in Place Pythonインストラクター 파이썬 강사
メンター、Naver Boostcamp Web/Mobile
プレゼンター、Naver Cloud YouTubeチャンネル
著者、LangChain & LangGraphによるAIエージェント構築
Wanted プレオンボーディングフロントエンド/バックエンドチャレンジホスト（累計参加者6,000名以上）
コーチ、スパルタ AI Plus コース（第1期）

カリキュラム

全体

18件 ∙ (3時間 16分)

セクション 1．Intro: 講義内容の紹介（受講申し込み前に必ずご視聴ください！）

1件 ∙ (9分)

1. この講義で扱うことと扱わないこと
09:49

セクション 2．AIエージェントの評価（Evaluation）を行うべき理由

2件 ∙ (19分)

セクション 3．ゴールデンデータセットの生成

6件 ∙ (1時間 4分)

4. Golden Datasetとは？
07:16
5. RAGASライブラリを活用したGolden Datasetの生成
15:16
6. LangSmithアカウントでのプロジェクトとAPI設定
02:40
7. カスタムエージェント + FAQを活用したGolden Datasetの生成
11:59
8. カスタムエージェント＋一般文書を活用したGolden Datasetの生成
17:28
9. Claude Code Agent Skillを活用したGolden Datasetの生成
09:25

セクション 4．[基礎] AIエージェント評価設計：何をどのように測定するのか

5件 ∙ (1時間 15分)

セクション 5．【深掘り】エージェントの性能を数値で読み解く方法

3件 ∙ (22分)

セクション 6．Outro: 全体内容の復習 + サービスの特性に合わせた評価戦略

1件 ∙ (5分)

講座掲載日: 2026/04/13

最終更新日: 2026/06/18

受講レビュー

全体

13件

4.8

13件の受講レビュー

qkenr1321559
受講レビュー 8
∙
平均評価 5.0
2026/04/20
修正済み
5
33% 受講後に作成
いつも信頼して受講しているジェイスンさんの講義です。講師のLangchain関連の講義はすべて受講しており、そのおかげで現在はジュニアAIエンジニアとして業務を行っています。実務で評価に関して色々と悩んでいたのですが、ちょうど良いタイミングで講義が公開されたので、早速学習して適用しようとしています。いつも質の高い講義を提供してくださり、ありがとうございます。追加で別件の質問なのですが、今回本を出版されたことを今さら知りました。まだ本は購入していないのですが、講義をすべて受講した状態でも、本で学習する価値があるかどうかお伺いしたいです。いつも受講生の立場に立って説明し共有してくださるので、良い先輩（サス）のような安心感がある講義です。改めて、いつも素晴らしい講義をありがとうございます。 :)
- jasonkang
  知識共有者
  2026/04/20
  ソンギュさん、こんにちは！素敵なフィードバックをありがとうございます。講義を受講されたことがAIエンジニアとしてのキャリアに役立ったとのこと、講義の効果が証明されたようでとても誇らしい気持ちです。共有していただきありがとうございます。講義よりも本の方では、もう少し多様な評価戦略や方法を扱ってはいます。ですが、講義でも十分に評価理論を扱っているため、講義をすべて受講されたのであれば、本はあえて購入しなくても大丈夫だと思います（本を販売する立場として、このようなことを言ってはいけないかもしれませんが😅）。また良い講義でお会いできるよう努めます！
- qkenr1321559
  2026/04/20
  あ。むしろ正直にお話しいただいて、とても信頼できますし、ありがとうございます..！！ :) これからもすぐにアーリーバードで一番に受講するようにします。よろしくお願いいたします！
mglee8619
受講レビュー 2
∙
平均評価 5.0
2026/06/18
5
100% 受講後に作成
講義ありがとうございました。 LangChainからLangGraphまで、講師の方の講義で多くのことを学びました。次の講義も楽しみにしています。
iris1224
受講レビュー 5
∙
平均評価 5.0
2026/06/20
5
100% 受講後に作成
最近のように新しいものが次々と溢れ出る状況の中で、エージェントの信頼性と品質について悩んでいたところ、質の高い講義を聴くことができ、大変助かりました。また次回も、面白くて有益な講義を期待しています。ありがとうございました。
doyle744531
受講レビュー 2
∙
平均評価 5.0
2026/07/01
5
33% 受講後に作成
112
受講レビュー 8
∙
平均評価 5.0
2026/06/28
5
61% 受講後に作成

jasonkangの他の講座

知識共有者の他の講座を見てみましょう！

RAGを活用したLLM Application開発（feat. LangChain）

jasonkang

シリコンバレー GenAI ハッカソン優勝者から学ぶ RAG。実務ノウハウがぎっしり詰まっています

初級

LLM, RAG, LangChain

RAGを活用したLLM Application開発（feat. LangChain）

jasonkang

LangGraphを活用したAI Agent開発 (feat. MCP)

jasonkang

大手企業AIエージェント担当者のノウハウが詰まったLangGraph。現場で苦労しながら習得した知識をお伝えします。

初級

prompt engineering, LLM, AI Agent

LangGraphを活用したAI Agent開発 (feat. MCP)

jasonkang

会社ですぐに使える業務自動化AIエージェント (w. n8n, LangGraph)

jasonkang

人工知能、AI、エージェント…何か途方もないものに見えますが、実際に取り組んでみると案外難しいことではありません。そうであるからこそ、ごく簡単な機能でさえも自身の手で実装してみることが非常に重要となります。会社で実際に活用できる実践的なプロジェクトを通じて、多様なユースケースを自ら体験し、AIエージェントの活用法、さらには応用技術までを習得していきます。

初級

n8n, AI, LangChain

会社ですぐに使える業務自動化AIエージェント (w. n8n, LangGraph)

jasonkang

1時間で終えるLangChain基礎

jasonkang

コーヒー一杯の価格で楽しむ(?)公式ドキュメントから核心だけを抜粋したLangChain基礎講座です。本格的な開発に入る前にLangChainの文法に慣れましょう!

初級

prompt engineering, LLM, LangChain

1時間で終えるLangChain基礎

jasonkang

実務に直接適用するストーリーブックとUIテスト

jasonkang

ストーリーブックの活用法A to Z.ストーリーブックのすべてを表示します

初級

storybook, ui-testing, React

実務に直接適用するストーリーブックとUIテスト

jasonkang

Flutterで作るLLMチャットボット (feat. Gemini)

jasonkang

Flutterが初めてですか？ Flutter Contributorが最初から一つずつご紹介します！ Geminiを活用したAIプロジェクトでFlutter開発を始めてみましょう

初級

Flutter, Chatbot, gemini

Flutterで作るLLMチャットボット (feat. Gemini)

jasonkang

実務に直接適用する AWS デプロイ

jasonkang

AWSでサービスをデプロイ/運営したい方のために用意しました。

初級

AWS, Docker, aws-ecs

実務に直接適用する AWS デプロイ

jasonkang

2時間で終わるフロントエンドテスト基本機

jasonkang

テストコード！どこから始めなければならないのか、大変な方のために準備しました。テスト作成から、自動化による配布まで一度に！

初級

React, Cypress, Jest

2時間で終わるフロントエンドテスト基本機

jasonkang

似ている講座

同じ分野の他の講座を見てみましょう！

会社ですぐに使える業務自動化AIエージェント (w. n8n, LangGraph)

jasonkang

初級

n8n, AI, LangChain

会社ですぐに使える業務自動化AIエージェント (w. n8n, LangGraph)

jasonkang

AIエンジニア入門者のための講義

Sungmin Kim

AIエンジニア入門者のための講義は、データ処理からモデル開発、クラウドとMLOps、そして倫理的考慮まで、全過程を短期間で体験できるように構成されています。単にモデルを作るだけでなく、実際のサービスへとつなげる過程を理解し、実務感覚を身につけることに重点を置いています。AIを初めて学ぶ方も無理なく進められるよう、実習と例題を交えて進行します。

入門

Python, Machine Learning(ML), FastAPI

AIエンジニア入門者のための講義

Sungmin Kim

本当に現場で通用するOCR、このように作ります。

nexthumans

実務で本当に使えるOCR技術を、しっかり学びたいならこの講座一つで完結！非定型文書や複雑なレイアウトでも98%以上の精度を目指し、最新のSOTAモデルと実践ノウハウをもとに企業レベルのOCRプロジェクトを一緒に構築していきます。

初級

Python, AI, openai

本当に現場で通用するOCR、このように作ります。

nexthumans

(AIクオンツ) コードを一行も書かずに株式自動分析システムを作る feat. Claude CLI

skysungsisi0926

毎日2,500銘柄、いつまで自分でチェックし続けますか？大引け後に急騰株を探してネイバー証券を漁り、ニュースを読みながら好材料か悪材料かを判断し、外国人・機関投資家の需給を一つ一つ確認し、チャートを開いてパターンを分析する…。これを毎日繰り返していませんか？私もそうでした。仕事が終わってから2〜3時間を銘柄分析に費やし、それでも見逃す銘柄の方が多かったです。 KOSPIとKOSDAQを合わせれば2,500銘柄を超えますが、人間が毎日すべてを見ることは不可能ですから。 --- だから、システムを作りました毎日大引け後に、自動で2,500銘柄を分析するシステムを作りました。 - 株価、需給、ニュースを自動で収集し - AI（Gemini）がニュースを読んで好材料・悪材料を判別し - 6つのファクターで15点満点のスコアを付け - 基準をクリアした銘柄だけを選別して、エントリー価格・損切り価格・利確価格まで計算し - テレグラムで通知を送ってくれます私は仕事の後にスマホを確認するだけで済みます。さらに、毎週土曜日になるとシステムが自ら先週の成果を分析し、損切りライン、利確ライン、保有期間を自動で調整します。システムが勝手に学習し、改善されていく構造です。 --- ですが、私は開発者ではありませんこのシステムのコードを私が直接書いたわけではありません。すべてAIに言葉で指示しました。「今日5%以上上昇した銘柄の中で、売買代金が500億ウォンを超えるものだけを抽出して」「このニュース3つをGeminiに送って、好材料かどうか判断させて」「毎日午後4時に自動で実行されるようにスケジューラーを作って」こう言えば、AI（Claude）がコードを作ってくれます。これが「バイブコーディング（Vibe Coding）」です。 --- この講義で、全く同じシステムを作ります 58回の講義を通じて、私が実際に毎日使用しているシステムを最初から最後まで一緒に作ります。データ収集から始まり、 AIニュース分析、スコアリングエンジン、シグナル生成、 Flask APIサーバー、Next.jsウェブダッシュボード、テレグラム自動通知、そして自己学習システムまで。 Jupyter Notebookが成果物ではありません。実際に毎日稼働するウェブダッシュボードとテレグラム通知が成果物です。コーディングを知らなくても大丈夫です。毎回の講義でClaudeにどう伝えればいいかをお見せします。皆さんがそれを真似すれば、同じ結果が得られます。 --- こんな方におすすめです - 毎日銘柄を分析する時間が足りない会社員投資家 - 自動化システムを持ちたいが、コーディングがわからない方 - クオンツ/システムトレードに興味があるが、どこから始めればいいかわからない方 - AIを実戦で活用する方法が知りたい方 --- ⚠️ この講義は投資収益を保証するものではありません。株式分析ツールを自作してみるプログラミング講義です。実際の投資判断は受講生本人の責任となります。

初級

Python, Flask, Next.js

(AIクオンツ) コードを一行も書かずに株式自動分析システムを作る feat. Claude CLI

skysungsisi0926

Pythonで試す自律走行

hjk1000

この講義が特別な理由：主要なメリット • 直感的な視覚化：Pygame 2Dシミュレーションでアルゴリズムの動作をリアルタイムで直接確認 • 実践的な実装経験：理論を超えて直接コーディングしながら自律走行アルゴリズムを体得 • 主要アルゴリズムのマスター：ダイクストラ、ピュアパス追従、ICPなど必須アルゴリズムを集中学習 • 段階的な深掘り学習：基礎からSLAMまで体系的な難易度構成 • LidarベースのSLAM：未知の環境でのマップ構築と位置推定の実習

初級

Python, Autonomous Driving, slam

Pythonで試す自律走行

hjk1000

(ディープラーニングモデリング入門)勾配降下法から誤差逆伝播まで、ディープラーニングの核心理論を数式/コードでマスター!

fasoft

100回以上実施したディープラーニング教育の経験をもとに、受講生が最も難しく感じた核心的な基礎理論を体系的にまとめた講義です。この講義は非専攻者でも理解できるよう、数学的直観、モデル学習原理、コード実装を段階的に結びつけて説明し、単純なライブラリの使い方ではなく、AIモデルが学習される根本的な構造と動作原理を深く扱います。勾配降下法、誤差関数、最適化、パーセプトロン、多層ニューラルネットワーク、誤差逆伝播などディープラーニングの核心的な基礎技術を直接数式とコードで実装しながら、AI原理を理解する実力あるエンジニアへと成長できるよう設計された実践型入門コースです。

入門

Python, Tensorflow, AI

(ディープラーニングモデリング入門)勾配降下法から誤差逆伝播まで、ディープラーニングの核心理論を数式/コードでマスター!

fasoft

[AICE] Associate 資格取得のための的中模擬試験問題解説

AICE

1. 国内唯一の国家公認AI資格、AICE Associate合格のための模擬試験問題解説 2. 実際のAICE Associate出題問題と同一形式の模擬試験12回分の解説講座

初級

AICE-Certificate, Python, AI

[AICE] Associate 資格取得のための的中模擬試験問題解説

AICE

[NLP完全攻略 I] Attentionの誕生：RNN・Seq2Seqの限界からアテンションを実装しながら理解するNLP

Sotaaz

なぜAttentionが必要だったのか、そしてどのように動作するのかを「コードで直接実装しながら」理解します。この講義はRNNとSeq2Seqモデルの構造的限界から出発し、固定されたコンテキストベクトルが作り出す情報ボトルネック問題、長期依存性問題を実験で検証しその限界を解決するためにAttentionがどのように登場したのかを自然に繋げて説明します。単純に概念を紹介するのではなく、 RNNの構造的限界とSeq2Seqの情報ボトルネック問題を直接実験で確認し、これを解決するために登場した**Bahdanau Attention（加算的アテンション）**と **Luong Attention（内積アテンション）**を一つずつ実装しながらその違いを明確に理解します。各アテンションがどのような方式でQuery–Key–Value関係を形成し、重みを計算する過程でどのような数学的・直感的違いを持ち、なぜ後代モデルに繋がらざるを得なかったのかその特性と進化の流れまで自然に繋がります。 Attentionが文章と単語をどのように捉え、各単語がどのような方式で重要度を付与されて情報を統合するのかを数式 → 直感 → コード → 実験が一つに繋がった形で学習します。この講義はTransformerを正しく理解するための「基礎体力」を築く過程として、 Attentionという概念がなぜ革命的だったのか、そしてその後のすべての最新NLPモデル（Transformer、BERT、GPTなど）がなぜAttentionを核心構成要素とするのかを深く理解するようになります。 RNN → Seq2Seq → Attentionに繋がる流れを概念ではなくコードと実験で体化したい学習者に最適化された講義です。

入門

Python, Deep Learning(DL), PyTorch

[NLP完全攻略 I] Attentionの誕生：RNN・Seq2Seqの限界からアテンションを実装しながら理解するNLP

Sotaaz

[無料] Pythonを学ぶ前に学ぶべきPython超基礎

CODEXPERT

Pythonを学ぼうとするなら、この講義に注目！！！なんと無料〜正式科目受講や個人学習の前に、ぜひ先行学習用途として推奨いたします。

入門

Python

[無料] Pythonを学ぶ前に学ぶべきPython超基礎

CODEXPERT

ChatGPTとPythonでYouTube AI社員を作る

SungYong Lee

GPT APIを活用したプログラムを作成し、画像生成や動画生成まで！

初級

ChatGPT, gpt, Python

ChatGPTとPythonでYouTube AI社員を作る

SungYong Lee

DDPMからDDIMまで、実装しながら学ぶDiffusion完全攻略 I

Sotaaz

この講義は拡散モデル(Diffusion Model)の進化過程を論文とコードで完全制覇する実戦中心のマスタークラスです。 DDPM(Denoising Diffusion Probabilistic Model)とDDIMなど、生成AIの核心モデルたちを論文原理から直接実装しながら学習します。各モデルの登場背景、数式、ネットワーク構造(U-Net、VAE、Transformer)、学習過程(Noise Schedule、Denoising Step)、そして性能向上を導いたアイデアたちを段階別に分析します。受講生はすべてのモデルをPyTorchベースで直接コーディングし、論文を理解することに留まらず「再現し応用できる実務能力」を得ることになります。また、モデル間の違いと発展の流れを比較し、どのように拡張されるかを明確に理解するようになります。この講義は理論・コード・実習を一つに、研究者・開発者・創作者すべてに生成モデルの進化を体系的に習得できる旅程を提供します。論文を「読むこと」を超え、直接実装しながら「理解し再創造」する経験を今始めてください。

初級

Python, Deep Learning(DL), AI

DDPMからDDIMまで、実装しながら学ぶDiffusion完全攻略 I

Sotaaz

AI活用のデジタルトランスフォーメーション (Digital Transformation Using AI)

pnuswedu

Pythonを活用して機械学習技術を習得し、実際のデータからの情報抽出方法や予測モデルの開発能力を向上させましょう！

入門

AI, RPA, Python

AI活用のデジタルトランスフォーメーション (Digital Transformation Using AI)

pnuswedu

（ラズベリーパイを利用した）AI人工知能自律走行自動車作り

usefulit

ラズベリーパイと様々なセンサーを活用してAIベースの自律走行自動車を直接製作してみる実習型講座です。

入門

Python, Raspberry Pi

（ラズベリーパイを利用した）AI人工知能自律走行自動車作り

usefulit

AIコメント自動化プログラム開発講義(ネイバーブログ)

lread90

Chatgptが私の隣人が書いた記事を読んでコメントするプログラムマーケティング自動化、近隣管理プログラム開発講義

初級

Python, Naver Searching Keyword, Blog

AIコメント自動化プログラム開発講義(ネイバーブログ)

lread90

2026年AI入門：学生/大学院生/開発者はどのようにAIを始めるべきか？

anjaeju

- 私は4年目のAIスタートアップを運営しているResearch Engineer/AI PMです。 - この動画は人工知能を「今」、「2026年」に勉強を始めようとする方々のための講義です。 - 大学生の友人たちを見ていると、人工知能をどのように始めればいいのか見当もつかない友人が多いです。 - この講義を聞いた後、人工知能の勉強を始められるようになれば嬉しいです。 - ちなみに、この講義は「自分の業務にAI活用」または「GPTを利用した収益化方法の始め方」といった講義ではありません。 - 学生、大学院生、または開発者の方々が人工知能を勉強したい時、どのように始めればいいのかについての動画です。

入門

Python, AI, Machine Learning(ML)

2026年AI入門：学生/大学院生/開発者はどのようにAIを始めるべきか？

anjaeju

GPT APIを活用したYouTube動画要約AIの作り方

Essential

複雑なGPT APIとPythonを、最も簡単に実習中心で習得することを目指します。最新のChatGPT APIを活用してYouTube動画要約AIを開発し、それをStreamlitで構成してウェブアプリケーション形式で実装します。

初級

Python, Big Data, AI

GPT APIを活用したYouTube動画要約AIの作り方

Essential

専門四柱推命AIエージェント作り - フルスタックn8n+Python

nambaksa

万世暦、占星術、紫微斗数、姓名学、MBTIを統合した四柱推命分析AIエージェントを、n8nワークフローとPythonアルゴリズムで構築します。13の専門エージェントが協業し、商用レベルの四柱推命レポートを生成する実サービスシステムを最初から最後まで完成させます。

中級以上

Python, n8n, AI

専門四柱推命AIエージェント作り - フルスタックn8n+Python

nambaksa

ワンクリックでAIが生成するYouTubeショート動画作成自動化（n8n活用）

nightdaycoding

AIでYouTubeショート動画作成を自動化！！ n8nを使ってYouTubeショートを自動で作る方法をゼロから学びます。テキスト→画像/音楽→動画作成→アップロードまで、一連の流れを一度に構築します。テストモード/実践モードの使い分けや、コストを抑えるコツまで実習します。講義が終わればすぐに使える自動化テンプレート3つを完成させます。コーディングの知識がなくても進められるよう、ノードの配置から一歩ずつ学びます。 AIによるYouTubeショート制作の自動化に、ぜひ挑戦してみてください！

入門

Python, youtube-api, n8n

ワンクリックでAIが生成するYouTubeショート動画作成自動化（n8n活用）

nightdaycoding

たった1時間！自分のPCに導入する「自分専用のAI教育係」作り (Antigravity ライブコーディング) [ソースコード提供]

codebridge

[ソースコード提供] コーディングの知識がなくてもOK。Googleの最新ツール(IDX)でインストール不要、ブラウザですぐに完成！コーディングの文法学習はもう終わり！AIと対話しながら(Vibe Coding)、Google IDX環境で社内文書を完璧に理解するRAGチャットボットを構築し、ウェブでリアルタイムにデプロイする超高速実践コースです。

入門

Python, AI, LLM

たった1時間！自分のPCに導入する「自分専用のAI教育係」作り (Antigravity ライブコーディング) [ソースコード提供]

codebridge

[実践AIoT] スマートミラーメイカソン完璧対策：LLM、CV、ハードウェア設計まで

kodekorea

メイカソンで80%が詰まるポイント、今すぐ解決しましょう。 Raspberry Pi・コンピュータビジョン・LLM・3D設計まで4週間完成! デモ可能なスマートミラーPoCでメイカソン上位入賞達成!

初級

Python, Raspberry Pi, Arduino

[実践AIoT] スマートミラーメイカソン完璧対策：LLM、CV、ハードウェア設計まで

kodekorea

安定的なAIエージェントサービス運用のための評価（Evaluation）手法

4.8

受講後に得られること

丹精込めて作ったAIエージェントリリースしても大丈夫でしょうか？

🤯

😢

🤔

😳

確信が必要な瞬間に必要なもの？それはまさに、「AIエージェント評価」です。

安定したサービスの始まりAIエージェント評価

従来のソフトウェアとは異なるAIエージェントの特性

AIの非決定性

非定型問題

動的システム

AIエージェントの変化を適切に確認できなければ、サービスはいつでも崩壊する可能性があります。

実務にすぐ適用可能なAIエージェント評価方法

01.

コストと時間を節約するゴールデンデータセットの構築

RAGAS

Custom Agent

Claude Code Skill

02.

ビッグテックが採用したエージェント評価方法

E2E + コンポーネント評価

03.

Anthropicが教えるエージェントのパフォーマンスを数値で表現する方法

pass@k

pass^k

📚

学習カリキュラムの紹介

AIエージェント評価の必要性

Golden Dataset 構築戦略

AIエージェント評価指標の設計

エージェント性能定量分析の深化

このような方々の悩みを解決できます！

📌

AIエージェント開発者

📌

AIサービス運営担当者

📌

LLMベースのサービス企画者

受講前のご注意事項

こんな方に おすすめです

こんにちは jasonkangです。

カリキュラム

受講レビュー

jasonkangの他の講座

似ている講座

丹精込めて作ったAIエージェント
リリースしても大丈夫でしょうか？

確信が必要な瞬間に必要なもの？
それはまさに、「AIエージェント評価」です。

安定したサービスの始まり
AIエージェント評価

AIエージェントの変化を適切に確認できなければ、
サービスはいつでも崩壊する可能性があります。

実務にすぐ適用可能な
AIエージェント評価方法

コストと時間を節約する
ゴールデンデータセットの構築

ビッグテックが採用した
エージェント評価方法

Anthropicが教える
エージェントのパフォーマンスを数値で表現する方法

このような方々の悩みを
解決できます！

こんな方に
おすすめです

こんにちは
jasonkangです。