本文へスキップ
スキルアップカレッジ

AIエージェント入門

IT基礎知識 初級〜中級 全8レッスン 約200分

公開日:

コース概要

「AI エージェントが仕事を全部やってくれる」——2024〜2025 年に SNS や PR 動画でよく目にしたフレーズです。一方、エージェントを業務に組み込んでいる現場では、もう少し落ち着いた議論が進んでいます。「どこまで自律的に任せ、どこから人間が確認するか」「エージェントが失敗したことをどう検知するか」「複数のエージェントが連携するときの暴走をどう防ぐか」——こうした設計・評価・リスク管理の論点こそ、本番運用の腰になります。本コースは、2026 年 6 月時点の最新モデル(Claude Opus 4.7・GPT-5.5・Gemini 3.1 Pro)と標準プロトコル(MCP)を前提に、AI エージェントを「観察・思考・行動の循環を持つ自律的システム」として体系的に学びます。実装コードには踏み込まず、「自社のユースケースで何ができ、何をしてはいけないか」を判断できる軸を、8 レッスンで提示します。

学習の流れ

レッスン 1 で AI エージェントの定義と、LLM チャットとの違い、2026 年 6 月時点の主要モデルと reasoning モデルの位置づけを押さえます。レッスン 2 はエージェントを構成する 5 要素(観察・思考・行動・記憶・道具)のフレームワークを学び、自社ユースケースを分解する発想を持ちます。レッスン 3〜4 は「外部世界との接続」と「プランニング」で、Function Calling/MCP/ReAct/Plan-and-Execute/Reflection など代表的な技術を扱います。レッスン 5 は記憶とコンテキスト管理、レッスン 6 はマルチエージェント協調を扱います。レッスン 7 は評価とデバッグの中核で、本コースの中心メッセージとなる「うまく動いたをどう測るか」の運用設計を提示します。最後のレッスン 8 で、自律性の 5 レベル・Human-in-the-Loop・プロンプトインジェクション対策・業務適用のチェックリスト、コース修了後の学習方向を案内します。前半(レッスン 1〜2)は「考え方の土台と全体像」、中盤(レッスン 3〜6)は「構成要素ごとの設計」、後半(レッスン 7〜8)は「評価とリスク管理」という三段構えです。

このコースで学べること

  • AI エージェントを「LLM チャットの延長」ではなく「観察・思考・行動の循環を持つ自律的システム」として捉えられる
  • エージェントの 5 つの構成要素(観察・思考・行動・記憶・道具)で、自社のユースケースを設計上分解できる
  • Function Calling・MCP・JSON Schema を「外部世界との接続インターフェース」として理解できる
  • ReAct・Plan-and-Execute・Reflection など代表的なエージェントパターンを使い分けられる
  • 短期・長期・エピソードという 3 種類の記憶と、コンテキスト管理の基本を持てる
  • マルチエージェント設計(Orchestrator-Worker・Hierarchical・Debate)の発想と限界を理解する
  • エージェントの「うまく動いた」を測る評価設計(Task Success Rate・トレース・LLM-as-a-Judge)ができる
  • 自律性の 5 レベルと Human-in-the-Loop を軸に、業務適用のリスク管理を設計できる

対象者

社内で AI エージェント/自律 AI の導入を任されている PM・企画・コンサル・SE。生成 AI 入門・プロンプトエンジニアリングを学び終え、次の段階として「自律的に動く AI」の設計と評価を学びたい方。AI を業務に組み込む中小〜中堅企業の経営者・幹部。エンジニアでも、エージェント設計・評価・リスク管理の体系を整理したい方に役立つ

講師紹介

高梨 結衣(たかなし ゆい)

AI エージェント・アドバイザー/元 AI スタートアップ CTO

新卒で米系大手 IT 企業の東京オフィスに機械学習エンジニアとして入社し 5 年。レコメンデーション基盤と社内向け LLM ツールを担当した。2022 年に国内 AI スタートアップに参画し、エージェント特化のプロダクトを CTO として立ち上げ・拡大(社員 0→40 名、シリーズ B まで)。ReAct ベースの自律タスク実行、社内文書 RAG、MCP サーバーの設計・運用を経験。2025 年に独立し、現在は中堅 IT 企業 3〜4 社で AI エージェント導入のアドバイザリーを並行。スタンス:「派手な自律性デモ」より「人間が確認できる範囲で粛々と価値を生むエージェント」の運用設計を信条とする

受講される方へのメッセージ

「「AI エージェント」という言葉は、2024〜2025 年に一気に広がりました。SNS や PR 動画では「全自動で仕事が片付く魔法のシステム」のように描かれることが多いですが、実務で運用しているエンジニアの感覚はずいぶん違います。本コースは、2026 年 6 月時点の最新モデルと標準プロトコル(reasoning モデル、MCP、Function Calling)を前提に、AI エージェントを「観察・思考・行動の循環を持つ自律的システム」として体系的にお伝えします。実装コードには踏み込まず、設計・評価・リスク管理を中心に「自社のユースケースで何ができ、何をしてはいけないか」を判断できる軸を、一緒に持ち帰っていただければ幸いです」

レッスン一覧

  1. 1

    AI エージェントとは何か——「答える AI」から「動く AI」へ

    エージェントの定義、LLM チャットとの違い、観察・思考・行動の循環、2026 年 6 月時点の主要モデル(Claude Opus 4.7/GPT-5.5/Gemini 3.1 Pro)と reasoning モデルの位置づけ、本コースの守備範囲を学ぶ

  2. 2

    エージェントの 5 つの構成要素——観察・思考・行動・記憶・道具

    5 要素フレームワーク、観察(状況把握)、思考(プランニング)、行動(外部世界への作用)、記憶(短期・長期・エピソード)、道具(ツール使用)、5 要素で自社ユースケースを分解する発想を学ぶ

  3. 3

    ツール使用と Function Calling——外部世界との接続

    Function Calling/Tool Use の仕組み、JSON Schema、Model Context Protocol(MCP、Anthropic 2024 年 11 月)、ツール選定の発想、権限とサンドボックスの設計、出力検証とリトライを学ぶ

  4. 4

    プランニングとエージェントパターン——ReAct・Plan-and-Execute・Reflection

    ReAct(Yao et al. 2022)、Plan-and-Execute、Reflection/Self-correction(Shinn et al. 2023 ほか)、パターンの使い分け、reasoning モデル時代のプランニング、暴走を防ぐ設計を学ぶ

  5. 5

    記憶とコンテキスト管理——短期・長期・エピソード記憶

    コンテキストウィンドウの限界、Sliding Window と要約による圧縮、エピソード記憶、ベクトルデータベース、RAG とエージェントの接続、Lost in the Middle(Liu et al. 2024)を学ぶ

  6. 6

    マルチエージェント協調——分業と統合

    マルチエージェントの設計パターン、Orchestrator-Worker、Hierarchical、Debate、Reflection between agents、2026 年時点の主要フレームワーク(LangGraph・AutoGen・CrewAI・Claude Code の Subagent など)、コスト・遅延・可観測性の問題を学ぶ

  7. 7

    評価とデバッグ——エージェントの「うまく動いた」をどう測るか

    エージェント評価の難しさ、Task Success Rate、End-to-End vs Step-by-Step、トレース、LLM-as-a-Judge、オブザーバビリティツール、A/B 比較、本番でのモニタリングと回帰検知を学ぶ

  8. 8

    リスク管理と業務応用——自律性のレベル・Human-in-the-Loop・コース修了後

    自律性の 5 レベル、Human-in-the-Loop の設計、プロンプトインジェクションと権限最小化、コスト管理、業務適用のチェックリスト、2026 年の業界動向、コース修了後の学習方向を学ぶ

  9. 総復習テスト

    全レッスンの内容を振り返るテスト

このコースの用語集(63語)
AI エージェント(えーあい えーじぇんと)
目的に応じて環境を観察し、計画を立て、ツールや行動を選択して目的に向かって進む、自律的に動くソフトウェアシステム。観察・思考・行動の循環を持つ点で、単発のやり取りで完結する LLM チャットと区別される。
Action
エージェントの 5 要素の 1 つ「行動」。思考の結果を外部世界に作用させる出力。Function Calling、メッセージ送信、コード実行、ほかのエージェント起動、ユーザーへの質問などが該当する。
イテレーション(いてれーしょん)
設計→評価→改善のサイクルを繰り返すこと。エージェント開発で「魔法のプロンプト」を探すのではなく、評価セットを使って継続的に磨き続ける運用視点を本コースが推奨する。
Orchestrator-Worker(おーけすとれーたー・わーかー)
マルチエージェントの基本パターン。Orchestrator が全体の進行を管理し、Worker(専門エージェント)にタスクを振り分け、結果を統合する。設計がシンプルで責任が明確、デバッグもしやすい。
Observation(おぶざーべーしょん)
ReAct ループの 3 段階のうち、ツール実行の結果を読み取る段階。Thought → Action → Observation → Thought ……と繰り返す。
オブザーバビリティ(おぶざーばびりてぃ)
エージェントの実行状況・コスト・失敗パターン・パフォーマンスを観察可能にする仕組み全般。LangSmith・LangFuse・Arize・Helicone などの専用ツール群が普及している。本番運用には前提インフラ。