ValueAlpha：リターンが観測される前に、LLMが判定する投資の論拠を合意ゲート付きでストレステストする手法

arXiv cs.AI / 2026/4/29

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、長期投資における「事後（リターン確定）評価」の問題を指摘しており、実現したリターンが意思決定の品質を最終的に決める一方で、開発やガバナンスに活用するには到着が遅すぎ・ノイズも大きいと述べています。
さらに、検証されていないLLMジャッジは、金融判断ではなく、冗長さ・自信・ルーブリックの模倣といった表面的要素を高く評価してしまう可能性があると論じています。
ValueAlphaは、LLMが判定する「投資の論拠」主張を、公開可能・条件付き・無効のいずれかに分類するための、事前登録された合意ゲート型ストレステスト手順として提案されています。
制御された資本配分プロトタイプ（正直な1,000サイクルに加え、事前登録された逆制御で計1,100軌道・5,500回のジャッジ呼び出し）では、全体の合意ゲート（κ̄w = 0.7168）を通過しつつ、過剰主張をいくつか阻止し、constraint_awarenessの次元ごとの崩壊や、単一ジャッジの順位がファミリー依存になるといった失敗モードも特定しています。
著者らは、ValueAlphaを「真の投資スキル」を測るランキングではなく、AIファイナンス評価のための事前校正（pre-calibration）の計測レイヤーとして位置づけています。

note

note

note

note

note