本文へスキップ
スキルアップカレッジ

生成AIとは何か——種類と歴史をつかむ

レッスン1:生成AIとは何か——種類と歴史をつかむ

このレッスンで学ぶこと

  • 生成AIの定義と従来のAIとの違いを説明できる
  • テキスト・画像・動画・音声・コードといった主要な種類を整理できる
  • 2022年のChatGPT登場から2026年までの大きな流れを把握する
  • 2026年現在の生成AIサービスの勢力図を理解する

生成AIとは何か

生成AIとは、文章・画像・音声・動画・プログラムのコードといった新しいコンテンツを、人間の指示に応じて自動的に作り出す人工知能のことを指します。英語ではジェネレーティブAI(Generative AI)と呼ばれます。

「生成」という言葉のとおり、何かを「作り出す」ことが特徴です。例えば、「桜が満開の京都の風景を描いて」と指示すれば、それに合った画像を作成してくれます。「会議の議事録を要約して」と指示すれば、長い文章から要点をまとめた文章を作ってくれます。

これまでコンピューターは、決められた手順をすばやく正確に実行することは得意でしたが、文章や絵を新しく生み出すことは苦手でした。生成AIは、この苦手分野を一変させた技術です。

従来のAIとの違い

人工知能、つまりAIという言葉自体は半世紀以上前から使われてきました。生成AIが登場するまでのAIは、主に「識別」や「予測」を目的としたものが中心でした。

例えば、写真に写っているのが犬か猫かを判定する画像認識AI、迷惑メールを自動的に振り分けるフィルタリングAI、天気の予測モデルなどです。これらは入力されたデータを分類したり、未来の数値を予測したりするのが主な役割でした。これらを総称して「識別AI」と呼ぶこともあります。

生成AIは、この役割を大きく拡張しました。識別や分類だけでなく、「新しいものを作り出す」ことができるようになったのです。

💡 ポイント 識別AIは「これは犬の写真です」と判定するもの。生成AIは「犬の写真を作って」と頼まれて新しい画像を作るもの。ざっくりこのように区別すると、両者の違いがイメージしやすくなります。

生成AIの主要な種類

生成AIは、何を生成するかによって、いくつかの種類に分けられます。代表的なものを5つ紹介します。

1つ目はテキスト生成AIです。文章を生成するAIで、現在の生成AIブームの中心です。ChatGPT・ClaudeGeminiなど、私たちが日常的に「AIと会話する」イメージで使うサービスの多くは、ここに分類されます。記事の執筆、メールの作成、要約、翻訳、アイデア出しなど、文章にかかわる幅広い作業をこなします。

2つ目は画像生成AIです。テキストで指示を出すと、それに合った画像を生成します。代表的なサービスにOpenAIのDALL-EMidjourneyStable Diffusionなどがあります。デザインの下書き、資料用のイラスト、広告素材の制作などに使われています。

3つ目は動画生成AIです。テキストや画像から動画を生成します。Google VeoRunwayKling AIなどが代表的です。短い宣伝動画やプロトタイプ映像などを、撮影なしで作れるようになっています。

4つ目は音声生成AIです。文章を読み上げる音声合成や、特定の声色を再現する音声クローンが含まれます。ナレーション制作、オーディオブック、コールセンターの自動応答などに活用されています。

5つ目はコード生成AIです。プログラムのソースコードを生成するAIで、ソフトウェア開発の現場で急速に普及しています。後のレッスンで触れるClaude CodeOpenAI Codex・GitHub Copilotなどが代表例です。

📝 補足 最近の主要な生成AIサービスは、これら複数の種類を1つのモデルで扱える「マルチモーダル」化が進んでいます。ChatGPT・Claude・Geminiは、いずれもテキストだけでなく画像も読み込んで対話できます。マルチモーダルについてはレッスン5で詳しく学びます。

生成AIの歴史——3つの大きな転換点

生成AIが爆発的に普及するまでには、3つの大きな転換点がありました。順を追って見ていきます。

第1の転換点:トランスフォーマーの登場(2017年)

現在の生成AIの土台になっているのが、「トランスフォーマー」という機械学習のモデル(仕組み)です。2017年にGoogleの研究者らが論文「Attention Is All You Need」で発表しました。

トランスフォーマーは、文章のような順序のあるデータを並列的に処理できる画期的な仕組みでした。これによって、巨大なデータを使った大規模な学習が現実的になりました。トランスフォーマーの中身については、レッスン2で詳しく学びます。

第2の転換点:ChatGPTの公開(2022年)

2022年11月、OpenAIがChatGPTを一般公開しました。これが、生成AIが世間に広く知られるきっかけとなった出来事です。

ChatGPTは、自然な会話形式で文章を生成できる質の高さで、公開後わずか2か月で月間アクティブユーザー数が1億人を超え、史上最も急速に普及した消費者向けアプリケーションのひとつになりました(出典:ロイター 2023年2月)。これ以降、Google・Anthropic・Metaなど多くの企業が独自の生成AIを開発・公開する競争が始まりました。

第3の転換点:AIエージェント時代への移行(2024〜2026年)

2024年から2026年にかけては、「ただ会話するAI」から「自律的に作業をこなすAI」への進化が加速しました。

AIエージェントと呼ばれるこの新しい形態のAIは、ユーザーが目標を伝えると、自分で計画を立て、ツールを使い、必要に応じて軌道修正しながら、タスクの完了まで進めます。コーディング、調査、データ分析、ドキュメント作成といった一連の作業を自動化できるようになってきました。AIエージェントについてはレッスン5で詳しく扱います。

2026年の生成AI——現在の勢力図

2026年5月時点で、生成AIサービスは数多くありますが、代表的なものは以下の通りです。

ChatGPTはOpenAIが提供するサービスで、現在の主力モデルはGPT-5.5です。2026年4月にリリースされ、事実誤りが大幅に減少し、コーディングやエージェント機能でも大きく性能を伸ばしました(出典:OpenAI 公式)。

ClaudeはAnthropicが提供するサービスです。2026年4月にClaude Opus 4.7が一般公開され、長文の読解や要約、慎重な対話を求められる業務で高い評価を得ています(出典:Anthropic 公式)。

GeminiはGoogleが提供するサービスで、2026年時点ではGemini 3.1 Proが最新の主力モデルです。テキスト・画像・動画・PDF・音声をまとめて扱えるマルチモーダル性能の高さが特徴です(出典:Google 公式ブログ)。

このほか、xAIのGrokMicrosoft CopilotPerplexity、中国発のDeepSeekなど、特色ある選択肢が増えています。

📝 補足 2025年初頭にはChatGPTが生成AIサービスの利用シェアの大半を占めていましたが、2026年にかけてGoogleのGeminiが急速にシェアを伸ばし、複数のサービスを使い分ける「マルチモデル時代」が到来しています。各サービスの特徴とおすすめの使い分けについては、レッスン3で詳しく整理します。

生成AIで何ができるのか

具体的に、現在の生成AIでできることを整理しましょう。代表的な使い道は次の通りです。

  • 文章作成・編集:メール、報告書、ブログ記事、企画書などの下書き
  • 要約・翻訳:長い文書を短くまとめる、外国語の文章を日本語に変換する
  • アイデア出し:商品名、キャッチコピー、企画案のブレインストーミング
  • 質問応答・調べもの:知らないことを質問して説明してもらう
  • 画像・動画・音声の制作:素材としてのビジュアル・映像・ナレーションを作成する
  • プログラム作成:簡単なコードからアプリの実装まで
  • データ分析:表やグラフを読み取り、傾向を要約する
  • ロールプレイ・学習相手:英会話の練習相手や面接の練習相手

一方で、苦手なこともたくさんあります。事実関係の正確さは保証されておらず、最新の出来事を知らない場合や、もっともらしい嘘を交えてしまう場合があります。なぜそうなるのかは、レッスン2で「ハルシネーション」という現象を通して詳しく学びます。

まとめ

このレッスンでは、以下のことを学びました。

  • 生成AIとは、文章・画像・音声・動画などを新しく作り出す人工知能のことである
  • 従来のAIが「識別」や「予測」中心だったのに対し、生成AIは「生成」を担う点が新しい
  • テキスト・画像・動画・音声・コードなど、生成するものによって種類が分かれる
  • 2017年のトランスフォーマー、2022年のChatGPT、2024〜2026年のAIエージェントが3つの大きな転換点である
  • 2026年の主要サービスはChatGPT・Claude・Geminiの3つが中心で、複数を使い分ける時代になっている

次のレッスンでは、ChatGPTやClaudeなどの土台になっている「大規模言語モデル」の仕組みを学びます。なぜAIは人間のような文章を作れるのか、そしてなぜ間違った情報を堂々と語ってしまうことがあるのか。仕組みを知ることで、生成AIとの付き合い方が見えてきます。


確認クイズ

このレッスンの理解度をチェックしましょう。