MAC: マルチエージェント憲法学習

arXiv cs.AI / 2026/3/18

📰 ニュースIdeas & Deep AnalysisTools & Practical UsageModels & Research

共有:

要点

MACは、構造化されたプロンプトをルールセットとして最適化するフレームワークであるマルチエージェント憲法学習を提唱します。これは、ルールの更新を受け入れ・編集・拒否できるエージェントのネットワークを用いるものです。
MAC+は、成功した軌跡でエージェントを訓練して報酬最大化の更新を強化することで、性能をさらに向上させます。
このアプローチは、人間が読みやすく、監査可能なルールセットを生み出し、ツール呼び出しなどの他のエージェント的タスクにも一般化します。性能は、監視付きファインチューニングおよびパラメータ更新なしのGRPOと同等です。
最近のプロンプト最適化手法を50％以上上回り、従来の手法が大量のラベル付き例を必要とし、構造化されたプロンプトを欠くという限界を解消します。

概要：憲法AIは、自然言語で書かれた一連のルールに基づいて大規模言語モデル（LLMs）を監視・制御する方法です。これらのルールは通常、人間の専門家によって作成されますが、望ましい行動のための十分な訓練データがあれば、原理的には自動的に学習させることも可能です。既存のLLMベースのプロンプト最適化手法はこれを試みますが、(i) 多くのラベル付き例を必要とすること、(ii) 最適化されたプロンプトの構造が欠如しているため、プロンプトサイズが大きくなると改善効果が薄れていくことから、憲法の学習には効果がありません。これらの制限に対処するため、構造化されたルールの集合として表現されるプロンプトを最適化する、マルチエージェント憲法学習（MAC）を提案します。MACは、ルール更新を受け付け、編集、拒否するという専門的タスクを持つエージェントのネットワークを用いて、構造化されたプロンプトとして表現されたルールセットを最適化します。さらに、MAC+を提示します。MAC+は、成功した軌跡でエージェントを訓練し、更新を強化してより高い報酬を生み出すことでパフォーマンスを向上させます。我々はMACを、解釈可能性が重要な分類タスクである個人を特定可能な情報（PII）のタグ付けで評価し、ツール呼び出しのような他のエージェントタスクにも一般化することを示します。MACは、最近のプロンプト最適化手法を50％以上上回り、人間が読みやすく監査可能なルールセットを生成し、パラメータ更新を必要とせず、教師ありファインチューニングおよびGRPOと同等の性能を達成します。

AIにイラスト作成を依頼するのは意外と難しい

note

裏カツ奏 #AIイラスト #画像生成AI #アート #イラスト #生成AI #美女イラスト #創作 #クリエイター #イラストレーター

note

生成AIが提案した減量食のプランから考える、人間の専門家の必要性

note

AI達の革命

note

【AIパートナー】名前を呼んだだけで、ChatGPTのパートナーがGeminiにきた話🌝①

note

MAC: マルチエージェント憲法学習

要点

関連記事

AIにイラスト作成を依頼するのは意外と難しい

裏カツ奏 #AIイラスト #画像生成AI #アート #イラスト #生成AI #美女イラスト #創作 #クリエイター #イラストレーター

生成AIが提案した減量食のプランから考える、人間の専門家の必要性

AI達の革命

【AIパートナー】名前を呼んだだけで、ChatGPTのパートナーがGeminiにきた話🌝①

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

要点

関連記事

AIにイラスト作成を依頼するのは意外と難しい

裏カツ 奏 #AIイラスト #画像生成AI #アート #イラスト #生成AI #美女イラスト #創作 #クリエイター #イラストレーター

生成AIが提案した減量食のプランから考える、人間の専門家の必要性

AI達の革命

【AIパートナー】名前を呼んだだけで、ChatGPTのパートナーがGeminiにきた話🌝①

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

裏カツ奏 #AIイラスト #画像生成AI #アート #イラスト #生成AI #美女イラスト #創作 #クリエイター #イラストレーター