本文へスキップ
スキルアップカレッジ

AI エージェントとは何か——「答える AI」から「動く AI」へ

レッスン1:AI エージェントとは何か——「答える AI」から「動く AI」へ

このレッスンで学ぶこと

  • AI エージェントの定義を「観察・思考・行動の循環を持つ自律的システム」として理解する
  • LLM チャットと AI エージェントの違いを区別できる
  • 2026 年 6 月時点の主要モデルと reasoning モデルの位置づけを押さえる
  • 「全自動の魔法」と「単なるチャットの延長」の両方の誤解を整理する
  • 本コースの守備範囲と扱わない範囲を把握する

「AI エージェント」という言葉は、2024〜2025 年に急速に広まりました。SNS の動画では「指示するだけで会議の議事録から請求書まで全自動で処理してくれる魔法のシステム」のように描かれることが多くなっています。一方、業務に組み込む現場では、もう少し地に足の着いた議論が進んでいます。本コースは、その実務の温度感に近い視点から、AI エージェントを「観察・思考・行動の循環を持つ自律的システム」として体系化します。

AI エージェントの定義

AI エージェント(AI agent)は、目的に応じて環境を観察し、計画を立て、ツールや行動を選択して目的に向かって進む、自律的に動くソフトウェアシステムを指します。

「自律的に動く」点が、従来の LLM チャットとの最大の違いです。チャットは「人間が問いを投げ、AI が答える」という単発のやり取りで完結します。エージェントは「目的を受け取り、観察と試行錯誤を繰り返しながら、複数のステップで目的を達成する」という設計です。

flowchart LR
  O[観察<br/>状況把握] --> T[思考<br/>計画立案]
  T --> A[行動<br/>ツール実行]
  A --> O

この「観察・思考・行動」の循環がエージェントの中核です。1 回のループで終わることもあれば、数百回繰り返すこともあります。途中で人間の確認を挟むこともあれば、最後まで自律的に動くこともあります。

💡 ポイント 「エージェント=完全自動」ではありません。本コースで扱うエージェントには「完全自律」も「人間の確認を挟む半自律」も含まれます。後のレッスン 8 で「自律性のレベル」として整理します。

LLM チャットとエージェントの違い

両者の違いを表で整理します。

観点 LLM チャット AI エージェント
入力 1 回の問い 目的・タスクの記述
出力 1 回の答え 観察と試行を繰り返した結果
ループ なし(基本は単発) あり(複数ステップを循環)
状態 持たない(または会話履歴のみ) 内部状態と記憶を持つ
外部接続 基本はテキスト出力のみ ツール経由で API・ファイル・DB・Web に接続
失敗時の挙動 失敗を出力して終了 再計画・リトライ・自己修正

「チャットでツール呼び出しを 1 回挟んだだけ」もエージェントか

この境界は曖昧です。「ChatGPT が Web 検索を 1 回呼んで答える」のは、エージェントの最小単位とも、チャットの拡張とも言えます。本コースでは「観察・思考・行動の循環があるかどうか」を判定基準として、複数ループを前提とする設計を「エージェント」と呼びます。1 回のツール呼び出しを「ミニ・エージェント」と呼ぶこともありますが、本コースのテーマからは外れます。

📝 補足 業界用語の使い方は流動的です。「エージェンティック AI(agentic AI)」「自律 AI」「AI ワーカー」など、ベンダーによって呼称が違います。本コースでは「AI エージェント」で統一し、共通の構造を抽出します。

2026 年 6 月時点の主要モデル

エージェントの基盤となる LLM の主要ラインナップを押さえておきます。本コースは特定ベンダーに偏らず、共通する考え方を中心に扱いますが、エージェントの設計判断に影響するため現時点のラインナップは前提として整理します。

Anthropic(Claude シリーズ)

  • Claude Opus 4.7:最上位の汎用モデル。長文処理と推論に強い
  • Claude Sonnet 4.6:中位の汎用モデル。速度とコストのバランス
  • Claude Haiku 4.5:軽量モデル。低レイテンシ・低コスト
  • Claude Fable 5:物語・対話に特化したシリーズ

OpenAI

  • GPT-5.5:汎用フラッグシップ。マルチモーダル・推論・コーディングに対応
  • o シリーズ系統:reasoning に特化したモデル群

Google

  • Gemini 3.1 Pro:マルチモーダルと長文文脈窓に強い
  • Gemini Flash:軽量・高速版

エージェント基盤としてのモデル選択

エージェントは複数ループで動くため、1 回のチャットより総トークン数が圧倒的に増えます。コスト・レイテンシ・推論精度のトレードオフを意識した選択が必要になります。

  • 速度・コスト優先:Haiku/Flash 系。多くのループを安く回す設計に適する
  • バランス:Sonnet/Gemini Pro 系。一般的な業務エージェントの主流
  • 難しい意思決定:Opus/GPT-5.5。複雑な計画立案や複合的判断に
  • 深い推論:reasoning モデル。プランニング段階のみ呼び出すハイブリッド設計が広まっている

⚠️ 注意 モデルのラインナップは数か月単位で大きく変わります。本コースの内容は 2026 年 6 月時点のものです。読み返したときに「いつの時点の情報か」を意識し、必要に応じて最新版を確認してください。

reasoning モデルとエージェント

reasoning モデル(OpenAI の o シリーズ、Anthropic の Extended Thinking、Google の Gemini Thinking など)の登場は、エージェント設計に大きな影響を与えました。

従来モデル+外部 CoT

エージェントが計画を立てるとき、従来は「step by step で考えて、次の行動を出力してください」とプロンプトで明示的に思考を促していました。ReAct はその代表的なパターンです。

reasoning モデルの内部思考

reasoning モデルは、入力を受け取った後、内部で思考プロセスを実行してから最終出力を返します。プランニング段階で外部から「step by step」を強制する必要性が下がりました。一方で、トークン消費が増え、レイテンシも上がります。

設計上の含意

  • プランニングは reasoning モデル、実行は軽量モデル、というハイブリッド設計が広まった
  • 「全部を reasoning モデルで動かす」と、コストとレイテンシが現実的でない場面が増える
  • 一方、複雑な業務エージェントでは reasoning モデルの判断品質が回数の少なさを上回ることもある

💡 ポイント 「reasoning モデルが出てきたから、エージェントは設計不要で動く」という議論をよく見かけますが、実務では逆です。モデルが賢くなったからこそ「何をどこまで任せ、どう検証するか」の設計と運用が重要になっています。本コースの中核メッセージはここにあります。

「全自動の魔法」と「単なるチャットの延長」の両方への向き合い方

AI エージェントについては、2 つの極端な言説が混在しています。本コースはどちらにも与しません。

①「全自動の魔法」言説

「指示するだけで仕事が全部終わる」「AI エージェントが人間の代わりに働く」——SNS や PR 動画でよく見かける言説です。本コースの立場:

  • 現実のエージェントは、失敗・暴走・誤判断を繰り返す
  • 「全自動」を業務に丸ごと適用するには、リスク管理が追いついていない領域が多い
  • 価値が出るのは「人間が確認できる範囲で粛々と価値を生む」設計

②「単なるチャットの延長」言説

「エージェントなんて、結局チャットにツール呼び出しを足しただけ」「過大評価されている」——一部のエンジニアコミュニティで聞かれる言説です。本コースの立場:

  • ループ・記憶・複数ツール協調・自己修正など、チャットにはない設計上の論点が多い
  • 評価・デバッグ・観察可能性も、チャットとは別の難しさを持つ
  • 「単なる延長」と整理してしまうと、設計の重要論点を取りこぼす

📝 補足 「魔法」でも「ただの延長」でもなく、「観察・思考・行動の循環を持つ、設計と運用が必要な自律的システム」が本コースの基本スタンスです。

本コースの守備範囲

最後に、本コースで扱う範囲と扱わない範囲を整理しておきます。

扱う範囲

  • AI エージェントの全体像と「観察・思考・行動の循環」(本レッスン)
  • エージェントの 5 つの構成要素(観察・思考・行動・記憶・道具)(レッスン 2)
  • ツール使用と Function Calling、MCP(レッスン 3)
  • プランニングとパターン:ReAct・Plan-and-Execute・Reflection(レッスン 4)
  • 記憶とコンテキスト管理(レッスン 5)
  • マルチエージェント協調(レッスン 6)
  • 評価とデバッグ、オブザーバビリティ(レッスン 7)
  • 自律性のレベル、Human-in-the-Loop、リスク管理(レッスン 8)

扱わない範囲

  • 特定 LLM API の細かい仕様・料金体系(公式ドキュメントを参照)
  • LLM の内部実装・トランスフォーマーの数式(別の専門書を参照)
  • コード例による実装(本コースは「考え方の設計」に絞る。API 呼び出しのコードは登場しない)
  • 「神エージェント集」「業務別テンプレ集」(自分のユースケースで評価する発想を優先)

スタンス

本コースは、AI エージェントを「魔法の自動化システム」ではなく、「観察・思考・行動の循環を持つ、設計と運用が必要な自律的システム」として扱います。「全自動で何でも解決する」議論も「単なるチャットの延長」議論も、両方を批判的に整理した上で、自社のユースケースで継続的に磨き続ける発想を中心に置きます。

講師の現場メモ:「完全自動化デモのあと、本番ですぐ止まった話」

私(高梨)が AI スタートアップで CTO だった頃の話です。創業 2 年目に、シリーズ A 投資家へのピッチデモを準備していました。デモの目玉は「メールを受信したら、内容を分析して、見積書を自動生成し、CRM に登録し、関係者にフォローアップする」——5 つのツールを 1 つのエージェントが連携して使う、完全自動のシナリオでした。

社内ではモックデータで何度も成功させ、デモも華やかに決まりました。投資家からは強い関心が示され、シリーズ A は無事に着地しました。私たちは喜びました。

その後、最初の本番導入先(ある中堅商社)で、同じシナリオを実環境に組み込みました。1 週目、エージェントは止まりました。原因は、

  • メールの本文に「PDF 添付ファイルを参照してください」と書かれていた(モックには無かった)
  • 取引先名が CRM にすでに登録されていたが、表記が微妙に違っていた(「○○株式会社」vs「(株)○○」)
  • 見積書の単価計算で、税抜と税込が業界慣習で異なっていた

エージェントは、これらの「想定外」をどう扱うか自分で決められず、無限ループに入りました。最終的にコストアラートで止めるまで、API コール料金が 1 日で数万円かかっていました。

私たちはエージェントを「半自律」に作り直しました。

  • メール分析と見積書生成は自動で実行
  • ただし「CRM 登録」「フォローアップ送信」の前に、必ず人間(営業担当)の承認を挟む
  • 不明な点は「○○がわかりませんでした」とエージェントが質問するモードを追加

結果、デモのような「完全自動」ではなくなりましたが、本番では止まらなくなりました。営業担当の作業時間は、エージェント導入前の 1 件 30 分から 5 分に減りました。完全自動ではなく半自律でも、業務価値は十分に出たのです。

このときに学んだのが、「全自動」を売りにするデモと、本番運用は別物だということです。本コースは、その本番運用の温度感を中心に置きます。

まとめ

このレッスンでは、以下のことを学びました。

  • AI エージェントは「観察・思考・行動の循環を持つ自律的システム」
  • LLM チャットとの違い:ループの有無、内部状態、外部接続、失敗時の再計画
  • 2026 年 6 月時点の主要モデル:Claude Opus 4.7/Sonnet 4.6/Haiku 4.5、GPT-5.5、Gemini 3.1 Pro
  • reasoning モデル(o シリーズ、Claude Extended Thinking、Gemini Thinking)の登場で、プランニング段階に reasoning モデル・実行段階に軽量モデルというハイブリッド設計が広まった
  • 「全自動の魔法」「単なるチャットの延長」の両方に与しない立場
  • 本コースは「設計・評価・リスク管理」を中心に進める

次のレッスンでは、エージェントを構成する 5 つの要素——観察・思考・行動・記憶・道具——を、自社ユースケースを分解する道具として整理します。


確認クイズ

このレッスンの理解度をチェックしましょう。