金融文書処理のためのマルチエージェントLLMアーキテクチャをベンチマークする：オーケストレーション・パターンの比較、コストと精度のトレードオフ、および本番スケーリング戦略に関する比較研究

arXiv cs.AI / 2026/3/25

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

原文を読む →

共有:

要点

本研究では、金融文書から構造化データを抽出するための4つのマルチエージェントLLMオーケストレーション・パターン（逐次パイプライン、並列ファンアウト／マージ、階層型スーパーバイザー・ワーカー、そして自己修正を行うリフレクシブなループ）をベンチマークする。
10,000件のSEC提出書類を用い、25の抽出フィールド種別を5つの軸（フィールドF1、文書レベルの精度、レイテンシー、文書あたりのコスト、トークン効率）で評価した結果、リフレクシブ・アーキテクチャはフィールドレベルF1が最良（0.943）である一方、逐次ベースラインに比べてコストが約2.3倍かかることが分かった。
階層アーキテクチャはコストと精度のトレードオフが最も良く、強い精度（F1 0.921）をベースラインコストの約1.4倍で達成し、好ましいコスト—精度のパレートフロンティア上に位置する。
アブレーション実験により、セマンティックキャッシュ、モデルルーティング、適応的リトライといった手法を組み合わせることで、リフレクシブによる改善の約89%を、ベースラインコストの約1.15倍という低い増分で回復できることが示される。
1日あたり1K〜100K文書というスループット／スケーリング実験では、非線形なスループット—精度劣化の挙動が観測され、規制された金融領域におけるキャパシティ計画の指針が得られる。

テクノロジー「AI警告危険人物」

note

裏カツ164日目！アメリア#AIイラスト #画像生成AI #アート #イラスト #生成AI #美女イラスト #創作 #クリエイター #イラストレーター

note

ぽんず｜管理職のAI仕事術

note

AIに丸投げしたら「自分の言葉」が消えた40代管理職の話

note

#2 : プロンプト研究講座【第18回】複数キャラクターの関係性の描き方

note

金融文書処理のためのマルチエージェントLLMアーキテクチャをベンチマークする：オーケストレーション・パターンの比較、コストと精度のトレードオフ、および本番スケーリング戦略に関する比較研究

要点

関連記事

テクノロジー「AI警告危険人物」

裏カツ164日目！アメリア#AIイラスト #画像生成AI #アート #イラスト #生成AI #美女イラスト #創作 #クリエイター #イラストレーター

ぽんず｜管理職のAI仕事術

AIに丸投げしたら「自分の言葉」が消えた40代管理職の話

#2 : プロンプト研究講座【第18回】複数キャラクターの関係性の描き方

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer