プロンプトインジェクションに対抗するAIエージェントの設計

OpenAI Blog / 2026/3/11

💬 オピニオンIdeas & Deep Analysis

共有:

要点

この記事は、エージェントのワークフローにおけるリスクの高い動作を制約し、機密データを保護することによって、ChatGPTがプロンプトインジェクションとソーシャルエンジニアリングにどのように対抗するかを説明します。
入力フィルタリング、コマンドのホワイトリスト化、サンドボックス化されたツールの連携、データ最小化など、操作の改ざんと情報漏洩を防ぐ具体的な防御メカニズムを概説します。
安全性と使いやすさのトレードオフについて論じ、より厳格な制御がエージェントの能力とパフォーマンスに与える影響を示します。
AIシステムにおける安全性を設計時から組み込む安全設計を提唱し、これらの保護を組み込むためのエンジニアリング、ガバナンス、ワークフローの変更をチーム全体に呼びかけます。

ChatGPTがエージェントのワークフローにおけるリスクのある操作を制約し、機密データを保護することによって、プロンプトインジェクションとソーシャルエンジニアリングに対してどのように防御するか。