コンピュータサイエンス > 応用人工知能
arXiv:2603.09127 (cs)
[2026年3月10日提出]
題名:Chaotic Dynamics in Multi-LLM Deliberation
Hajime Shimao とほか2名の著者による「Chaotic Dynamics in Multi-LLM Deliberation」という題名の論文PDFを表示
PDFを見る
HTML(実験的)
要旨:集合型AIシステムはますます多LLMの熟議(deliberation)に依存するようになっているが、反復実行に対する安定性は十分に特徴づけられていない。5者エージェントのLLM委員会を確率的動的システムとしてモデル化し、委員会の平均嗜好(committee mean preferences)における軌道の発散(trajectory divergence)から得られる経験的リャプノフ指数($hat{lambda}$)を用いて、実行間の感度を定量化する。12の政策シナリオにわたる因子計画(factorial design)で、$T=0$において不安定化への独立した2つの経路を特定する。均質な委員会での役割分化(role differentiation)と、無役割(no-role)な委員会でのモデルの異質性(model heterogeneity)である。重要なのは、これらの効果が、実務者がしばしば決定論的挙動を期待することの多い $T=0$ レジームでも現れる点である。HL-01ベンチマークでは、両経路により発散が増大し(それぞれ $hat{lambda}=0.0541$ と $0.0947$)、さらに均質な無役割委員会も正の発散領域に留まる($hat{lambda}=0.0221$)。両者を混ぜた条件(mixed+roles)は、不安定性が混ぜた無役割(mixed+no-role)より小さく($hat{lambda}=0.0519$ vs $0.0947$)、非加法的な相互作用が示される。メカニズムとしては、議長役(Chair-role)のアブレーションが $hat{lambda}$ を最も強く低下させ、さらに記憶ウィンドウを短縮するように設計したプロトコルのバリアントは、発散をより強く抑制する。これらの結果は、多LLMガバナンス・システムにおける中核的な設計要件として、安定性監査(stability auditing)を支持するものである。
| コメント: | |
| 分野: | 応用人工知能(cs.AI);マルチエージェントシステム(cs.MA) |
| 引用形式: | arXiv:2603.09127 [cs.AI] |
| (またはこの版については arXiv:2603.09127v1 [cs.AI]) | |
| https://doi.org/10.48550/arXiv.2603.09127
詳細を学ぶためにフォーカス
DataCite による arXiv 発行 DOI
|
書誌ツール
コード、データ、メディア
デモ
関連論文
arXivLabsについて
書誌および引用ツール
書誌エクスプローラ切り替え
書誌エクスプローラ (エクスプローラとは何ですか?)
Connected Papers 切り替え
Connected Papers (Connected Papers とは何ですか?)
Litmaps トグル
Litmaps (Litmaps とは?)
scite.ai トグル
scite Smart Citations (スマート引用(Smart Citations)とは?)
この論文に関連付けられたコード、データ、メディア
alphaXiv トグル
alphaXiv (alphaXiv とは?)
コードへのリンク トグル
論文向け CatalyzeX コードファインダー (CatalyzeX とは?)
DagsHub トグル
DagsHub (DagsHub とは?)
GotitPub トグル
Gotit.pub (GotitPub とは?)
Huggingface トグル
Hugging Face (Huggingface とは?)
コードへのリンク トグル
Papers with Code (Papers with Code とは?)
ScienceCast トグル
ScienceCast (ScienceCast とは?)
デモ
Replicate トグル
Replicate (Replicate とは?)
Spaces トグル
Hugging Face Spaces (Spaces とは?)
Spaces トグル
TXYZ.AI (TXYZ.AI とは?)
レコメンダーおよび検索ツール
Influence Flower へのリンク
Influence Flower (Influence Flower とは?)
CORE レコメンダー トグル
CORE Recommender (CORE とは?)
arXivLabs:コミュニティの共同協力者による実験的プロジェクト
arXivLabsは、共同協力者が当社のWebサイト上で新しいarXivの機能を直接開発し、共有できるようにするためのフレームワークです。
arXivLabsに取り組む個人および組織は、公開性、コミュニティ、卓越性、ユーザーデータのプライバシーという当社の価値観を受け入れ、賛同してくれています。arXivはこれらの価値観にコミットしており、それに準拠するパートナーのみと連携しています。
arXivのコミュニティにとって価値を追加するプロジェクトのアイデアはありますか? arXivLabsについて詳しく知る




