あらゆる応答が重要：テンソル分解によってLLMベースのマルチエージェントシステムの不確実性を定量化する

arXiv cs.AI / 2026/4/13

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、LLMベースのマルチエージェントシステム（MAS）における信頼性リスクが、通信ダイナミクスや役割依存関係によって生じ、単一エージェントの不確実性推定手法が捉えられないレベルの不確実性をもたらすことを強調する。
不確実性定量化に固有の課題として、マルチステップ推論にまたがって不確実性が連鎖すること、エージェント間の通信経路における変動性、そして通信トポロジの多様性の3つを特定する。
著者らは、推論の全軌跡を埋め込み行列として符号化し、複数の実行を高階テンソルとして集約することで、不確実性を定量化する枠組みMATUを提案する。
テンソル分解により、MATUは異なる不確実性源を切り分けて測定し、さまざまなエージェント構造に対して一般化できる、より包括的な信頼性指標を生成する。
多様なタスクや通信トポロジにわたる広範な実験結果から、MATUが統合的かつ頑健な不確実性推定を改善することを報告する。

Abstract

大規模言語モデルベースのマルチエージェントシステム（MAS）は、複雑な課題において単一エージェントシステムよりも一貫して高い性能を示す一方で、その複雑な相互作用は、通信ダイナミクスや役割依存関係に起因する重要な信頼性課題を引き起こします。既存の不確実性定量化（Uncertainty Quantification）手法は、通常は単一ターンの出力を対象として設計されているため、MAS特有の複雑さに対応できません。具体的には、これらの手法は次の3つの異なる課題に苦戦しています。すなわち、多段推論における連鎖的な不確実性、エージェント間の通信経路のばらつき、そして通信トポロジーの多様性です。このギャップを埋めるために、テンソル分解によって不確実性を定量化する新しい枠組みであるMATUを提案します。MATUは、最終テキスト出力の分析にとどまらず、推論の全軌跡を埋め込み行列として表現し、複数の実行結果を高次テンソルとして整理します。テンソル分解を適用することで、異なる不確実性の発生源を切り分け、定量化し、さまざまなエージェント構造に対して一般化可能な包括的な信頼性指標を提供します。さらに、MATUが多様な課題や通信トポロジーにわたって、全体的で頑健な不確実性を効果的に推定できることを示す包括的な実験を提供します。

ロボット用フィジカルAIのVLAがサブミリ精度獲得、Physical Intelligenceがオンライン強化学習で

日経XTECH

日立やNEC、フィジカルAIで脱「人月商売」／AIエージェント時代に台頭する「FDE」など、注目記事を音声化

日経XTECH

注目集める「AIエージェント」、一問一答型から自律的なシステムに

日経XTECH

新モデル「Claude Mythos」の衝撃数千の脆弱性を発見、一般公開せず

日経XTECH

「対応せざるを得ない」、Anthropicの「Mythos」に身構える日本の金融業界

日経XTECH

あらゆる応答が重要：テンソル分解によってLLMベースのマルチエージェントシステムの不確実性を定量化する

要点

Abstract

関連記事

ロボット用フィジカルAIのVLAがサブミリ精度獲得、Physical Intelligenceがオンライン強化学習で

日立やNEC、フィジカルAIで脱「人月商売」／AIエージェント時代に台頭する「FDE」など、注目記事を音声化

注目集める「AIエージェント」、一問一答型から自律的なシステムに

新モデル「Claude Mythos」の衝撃数千の脆弱性を発見、一般公開せず

「対応せざるを得ない」、Anthropicの「Mythos」に身構える日本の金融業界

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

要点

Abstract

関連記事

ロボット用フィジカルAIのVLAがサブミリ精度獲得、Physical Intelligenceがオンライン強化学習で

日立やNEC、フィジカルAIで脱「人月商売」／AIエージェント時代に台頭する「FDE」 など、注目記事を音声化

注目集める「AIエージェント」、一問一答型から自律的なシステムに

新モデル「Claude Mythos」の衝撃 数千の脆弱性を発見、一般公開せず

「対応せざるを得ない」、Anthropicの「Mythos」に身構える日本の金融業界

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

日立やNEC、フィジカルAIで脱「人月商売」／AIエージェント時代に台頭する「FDE」など、注目記事を音声化

新モデル「Claude Mythos」の衝撃数千の脆弱性を発見、一般公開せず