マルチLLM熟考におけるカオス的ダイナミクス

arXiv cs.AI / 2026/3/11

Ideas & Deep AnalysisModels & Research

要点

  • 本研究は、5エージェントからなるマルチLLM委員会を確率的力学系としてモデル化し、繰り返し実行時の安定性を分析している。
  • 不安定性の主な原因は二つ特定されている:同質的委員会内での役割分化と、役割がない委員会におけるモデルの異種性であり、これらは理論上決定的な条件下でも現れる。
  • 経験的リアプノフ指数により、異なる委員会構成や政策シナリオ全体で高い発散レベルが明らかにされ、カオス的ダイナミクスの存在が示されている。
  • 議長役の除去やメモリウィンドウ長を短縮するプロトコル調整により、不安定性が効果的に低減されることが示され、実践的な設計介入の可能性が示唆されている。
  • これらの発見は、信頼性の高い集合的AI行動を確保するために、マルチLLMガバナンスシステムの基盤設計要件として安定性監査の重要性を強調している。

コンピュータサイエンス > 応用人工知能

arXiv:2603.09127 (cs)
[2026年3月10日提出]

題名:Chaotic Dynamics in Multi-LLM Deliberation

Hajime Shimao とほか2名の著者による「Chaotic Dynamics in Multi-LLM Deliberation」という題名の論文PDFを表示
PDFを見る HTML(実験的)
要旨:集合型AIシステムはますます多LLMの熟議(deliberation)に依存するようになっているが、反復実行に対する安定性は十分に特徴づけられていない。5者エージェントのLLM委員会を確率的動的システムとしてモデル化し、委員会の平均嗜好(committee mean preferences)における軌道の発散(trajectory divergence)から得られる経験的リャプノフ指数($hat{lambda}$)を用いて、実行間の感度を定量化する。12の政策シナリオにわたる因子計画(factorial design)で、$T=0$において不安定化への独立した2つの経路を特定する。均質な委員会での役割分化(role differentiation)と、無役割(no-role)な委員会でのモデルの異質性(model heterogeneity)である。重要なのは、これらの効果が、実務者がしばしば決定論的挙動を期待することの多い $T=0$ レジームでも現れる点である。HL-01ベンチマークでは、両経路により発散が増大し(それぞれ $hat{lambda}=0.0541$ と $0.0947$)、さらに均質な無役割委員会も正の発散領域に留まる($hat{lambda}=0.0221$)。両者を混ぜた条件(mixed+roles)は、不安定性が混ぜた無役割(mixed+no-role)より小さく($hat{lambda}=0.0519$ vs $0.0947$)、非加法的な相互作用が示される。メカニズムとしては、議長役(Chair-role)のアブレーションが $hat{lambda}$ を最も強く低下させ、さらに記憶ウィンドウを短縮するように設計したプロトコルのバリアントは、発散をより強く抑制する。これらの結果は、多LLMガバナンス・システムにおける中核的な設計要件として、安定性監査(stability auditing)を支持するものである。
コメント:
分野: 応用人工知能(cs.AI);マルチエージェントシステム(cs.MA)
引用形式: arXiv:2603.09127 [cs.AI]
  (またはこの版については arXiv:2603.09127v1 [cs.AI]
  https://doi.org/10.48550/arXiv.2603.09127
詳細を学ぶためにフォーカス
DataCite による arXiv 発行 DOI

投稿履歴

提出者: Hajime Shimao [メールを見る]
[v1] 2026年3月10日(火) 02:59:11 UTC(272 KB)
フルテキストのリンク:

論文へのアクセス:

現在の閲覧コンテキスト:
cs.AI
< 前   |   次 >
次の閲覧に切り替え:

参考文献 & 引用

BibTeX形式で引用をエクスポート 読み込み中...

BibTeX形式の引用

×
データ提供元:

ブックマーク

BibSonomyロゴ Redditロゴ
書誌ツール

書誌および引用ツール

書誌エクスプローラ切り替え
書誌エクスプローラ (エクスプローラとは何ですか?)
Connected Papers 切り替え
Litmaps トグル
Litmaps (Litmaps とは?)
scite.ai トグル
コード、データ、メディア

この論文に関連付けられたコード、データ、メディア

alphaXiv トグル
alphaXiv (alphaXiv とは?)
コードへのリンク トグル
論文向け CatalyzeX コードファインダー (CatalyzeX とは?)
DagsHub トグル
DagsHub (DagsHub とは?)
GotitPub トグル
Gotit.pub (GotitPub とは?)
Huggingface トグル
Hugging Face (Huggingface とは?)
コードへのリンク トグル
Papers with Code (Papers with Code とは?)
ScienceCast トグル
ScienceCast (ScienceCast とは?)
デモ

デモ

Replicate トグル
Replicate (Replicate とは?)
Spaces トグル
Hugging Face Spaces (Spaces とは?)
Spaces トグル
TXYZ.AI (TXYZ.AI とは?)
関連論文

レコメンダーおよび検索ツール

Influence Flower へのリンク
Influence Flower (Influence Flower とは?)
CORE レコメンダー トグル
CORE Recommender (CORE とは?)
arXivLabsについて

arXivLabs:コミュニティの共同協力者による実験的プロジェクト

arXivLabsは、共同協力者が当社のWebサイト上で新しいarXivの機能を直接開発し、共有できるようにするためのフレームワークです。

arXivLabsに取り組む個人および組織は、公開性、コミュニティ、卓越性、ユーザーデータのプライバシーという当社の価値観を受け入れ、賛同してくれています。arXivはこれらの価値観にコミットしており、それに準拠するパートナーのみと連携しています。

arXivのコミュニティにとって価値を追加するプロジェクトのアイデアはありますか? arXivLabsについて詳しく知る