CADMAS-CTX:マルチエージェント委任のための文脈的能力キャリブレーション
arXiv cs.AI / 2026/4/21
📰 ニュースDeveloper Stack & InfrastructureIdeas & Deep AnalysisModels & Research
要点
- 本論文はマルチエージェントの委任を見直し、エージェントの有効な能力は静的なスキルプロファイルとして固定されるのではなく、タスクの文脈によって変動すると主張しています。
- CADMAS-CTXを提案し、各エージェントについて粗い文脈バケットごとに階層化された文脈条件付きBeta事後分布を学習して、その部分のタスク空間での経験を捉えます。
- 委任判断は事後分布の平均に不確実性ペナルティを加えたリスク配慮型スコアに基づき、証拠に基づいて十分に支持された場合にのみ、より適任のエージェントへルーティングすることを狙います。
- 文脈付きバンディットの枠組みにより理論的保証を示し、文脈の異質性が十分にある場合に文脈を考慮したルーティングが静的ルーティングより累積レグレットを低減すると証明しています。
- GAIAおよびSWE-benchでの実験では一貫した改善が示され(GAIA精度:0.442 vs 静的ベースライン0.381、SWE-bench Lite解決率:22.3%→31.4%)、アブレーションにより不確実性ペナルティが文脈タグ付けノイズへの頑健性を高めることが確認されています。

