セクション 5 / 42

AIの基礎

生成AIの種類

文章・画像・動画・音声・音楽…作るものでAIは分かれる

生成AI(ジェネレーティブAI)とは、学習したパターンをもとに“新しいもの”を作り出すAIの総称です。何を作るかで、ざっくり種類が分かれます。

文章・対話(LLM)
ChatGPT, Claude, Gemini など。文章作成・要約・翻訳・コード生成。
画像
Midjourney, DALL·E, Stable Diffusion など。
動画
Runway, Google Veo, Kling など。
音声(読み上げ)
ElevenLabs などのナレーション・音声合成。
音楽
Suno, Udio など。
コード/エージェント
Claude Code など。文章AIが“作業”までこなす。

中心にいるのは「LLM(大規模言語モデル)」

ChatGPTやClaudeの正体は LLM(Large Language Model=大規模言語モデル)です。大量の文章を学習し、「次に来そうな言葉」を高精度で予測して文章を作ります。賢く見えますが、本質は超高精度の“続きの予測”です。

「辞書」ではなく「文章の達人」

LLMは“事実を調べて答える辞書”ではなく、“それっぽい文章を作る達人”です。とても便利ですが、もっともらしい間違いを言うこともあります(→「注意事項」のセクションで詳しく)。

「サービス」と「モデル」は別物

ChatGPTやClaudeは“サービス(アプリ)”の名前で、その中身で動いているのが“モデル”です。たとえばClaudeには Fable/Opus/Sonnet/Haiku という性能違いのモデルがあります(→「Claudeの種類」で解説)。

理解度チェック

読み込み中…