Hubble：安全かつ自動化されたアルファ・ファクター発見のための、LLM駆動エージェンティック・フレームワーク

arXiv cs.AI / 2026/4/14

📰 ニュースDeveloper Stack & InfrastructureIdeas & Deep AnalysisModels & Research

共有:

要点

Hubbleは、量的ファイナンスにおける予測力のあるアルファ・ファクターを自動的に発見するための、LLM駆動のクローズドループなエージェンティック・フレームワークとして提案されている。大きな探索空間と低い信号対雑音比に対処する。
このアプローチでは、ドメイン固有のオペレーター言語のもとでLLMが候補を提案し、ASTベースのサンドボックス内でそれらを実行することで、決定論的な安全制約を強制し、解釈可能性を高める。
候補となるファクターは、横断的RankIC、年率化されたInformation Ratio、ポートフォリオの売買回転率を含む厳密な統計パイプラインによってスコアリングされる。
ヒューマンではなく進化的なフィードバックループが、上位のファクターと構造化されたエラーディアグノスティクスをLLMに返し、複数の生成ラウンドにわたる反復的な改良を可能にする。
752営業日のうちの30銘柄の米国株を用いた実験では、Hubbleは122件の候補から3ラウンドで181件の文法的に正しいファクターを評価し、計算上の完全な安定性を備えたまま、複合スコアのピーク0.827に到達した。

要旨: 定量ファイナンスにおいて予測的なαファクターを発見することは、巨大な組合せ的探索空間と、金融データに本質的に内在する低いシグナル対雑音比によって、依然として非常に困難な課題である。既存の自動化手法、特に遺伝的プログラミングでは、複雑で解釈不能な数式が生成されやすく、過学習に陥りがちである。本研究では、Hubbleを提案する。これは、閉ループのファクターマイニング枠組みであり、Large Language Models（LLM）を知的な探索ヒューリスティクスとして活用する。さらに、ドメイン固有のオペレーター言語と、Abstract Syntax Tree（AST）に基づく実行サンドボックスによって制約を課す。提案枠組みは、交差セクションのRank Information Coefficient（RankIC）、年率化されたInformation Ratio、そしてポートフォリオ回転率を含む厳密な統計的パイプラインによって、候補となるファクターを評価する。進化的なフィードバック機構は、上位の性能を示したファクターと、構造化されたエラーダイアグノスティクスをLLMに返すことで、複数の世代ラウンドにわたる反復的な改良を可能にする。752営業日からなる、米国株30銘柄のパネルを用いた実験では、3ラウンドにわたって122のユニークな候補から181の構文的に妥当なファクターを評価し、計算の安定性は100%を達成しつつ、最大の複合スコア0.827を得た。これらの結果は、LLM主導の生成と決定論的な安全性制約を組み合わせることで、自動ファクター発見において有効で、解釈可能で、再現可能なアプローチが実現できることを示している。