要約: 株式市場は、安定した条件のために最適化された予測モデルが、ボラティリティの高い期間にはしばしば機能しない、レジーム依存的な挙動を示します。既存のアプローチは通常、すべての市場状態を一様に扱うか、手動のレジームラベリングを必要とします。これは高コストで、市場のダイナミクスが進化するにつれてすぐに陳腐化します。本稿では、正常な市場状態からの逸脱を適応的に識別し、データを専門の予測経路に振り分ける適応型予測フレームワークを導入します。アーキテクチャは3つのコンポーネントから構成されています: (1)正常な市場条件で訓練されたオートエンコーダが再構成誤差を通じて異常なレジームを識別する、(2)安定な市場条件とイベント駆動の市場条件それぞれに特化したデュアルノード・トランスフォーマーネットワーク、(3)予測性能のフィードバックに基づいてレジーム検出閾値と経路ブレンディング重みを適応的に調整する Soft Actor-Critic 強化学習コントローラ。強化学習コンポーネントは、システムが適応的なレジーム境界を学習できるようにし、標準的な予測手法が失敗する市場状態を異常として定義します。1982年から2025年にわたる20銘柄のS&P 500を対象とした実験は、提案されたフレームワークが、強化学習コントローラなしで1日予測に対して0.68%のMAPEを達成し、完全な適応システムでは0.59%のMAPEを達成することを示しています。これは、ベースラインの統合ノードトランスフォーマーの0.80%と比較されます。方向性精度は、完全なフレームワークで72%に達します。システムは高ボラティリティ期間でも堅牢な性能を維持し、ベースラインモデルが1.5%を超える場合でもMAPEが0.85%を下回ります。アブレーション研究は、各コンポーネントが意味のある寄与をしていることを確認します。オートエンコーダのルーティングを除去すると相対的なMAPEの悪化は36%となり、続いてSACコントローラが15%、デュアルパスアーキテクチャが7%となります。
適応的レジーム認識株価予測のための、オートエンコーダゲート付きデュアルノード・トランスフォーマーと強化学習制御
arXiv cs.LG / 2026/3/20
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、正常な市場条件からの逸脱を識別し、データを専門化された予測経路へと振り分ける適応的な株価予測フレームワークを提案する。
- 三つの構成要素から成る: 正常条件で訓練されたオートエンコーダは再構成誤差を用いて異常を検出し、安定的なレジームとイベント駆動のレジームのためのデュアルノード・トランスフォーマー網、予測フィードバックに基づいてレジーム閾値とブレンディング重みを調整するソフトアクター・クリティック(SAC)コントローラ。
- 1982年から2025年までの20銘柄のS&P 500株を対象とした実験では、本手法はRLコントローラなしで0.68%のMAPE(平均絶対誤差率)、完全な適応システムを用いた場合には0.59%のMAPE(平均絶対誤差率)を達成し、方向性の正確さは約72%、基準のMAPEが1.5%を超える高ボラティリティ時にも堅牢な性能を示した。
- アブレーション研究の結果、各構成要素が性能に意味のある寄与を示すことが分かった:オートエンコーダのルーティングを除去すると相対MAPE劣化の約36%を占め、SACコントローラを除去すると約15%、デュアルパス構造を除去すると約7%を占める。
- 本研究は、レジーム認識を活用したRLガイド付き予測が金融市場の安定性と精度を高める可能性を示唆しており、変化する市場レジームに適応する取引システムの展開にも示唆を与える可能性がある。

