実資本下で動くオンチェーンLLMエージェントのためのオペレーティング層コントロール
arXiv cs.AI / 2026/4/30
📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- この論文は、実資本を用いるDX Terminal Proの21日間のデプロイで、ユーザー指示を検証済みのツール操作(取引アクション)へ変換する自律型オンチェーン言語モデルエージェントの信頼性を検証します。
- 3,505のユーザーファンド型エージェントにおいて、7.5M回のエージェント起動、約300K件のオンチェーンアクション、約$20Mの取引規模、そしてポリシー検証済み取引に対する99.9%の決済成功率が示されています。
- 著者らは、信頼性はベースモデル単体ではなく、プロンプトコンパイル、型付きコントロール、ポリシー検証、実行ガード、メモリ設計、トレース可観測性を組み合わせた「オペレーティング層」によって生まれると結論づけています。
- 事前テストでは、テキストのみのベンチマークでは測りにくい失敗モード(取引ルールの捏造、手数料による停止、数値のアンカリング、ケイデンス取引、トークノミクスの誤読など)が明らかになり、ハーネスの改善でそれらの頻度が大きく低減され、資本投入も増加しました。
- 論文は、資本を管理するエージェントはユーザーの指示からプロンプト/推論、検証済みアクション、最終的な決済に至るまでの全経路で評価すべきだと主張しています。