抽象: 本研究では、非同期アラインメントを扱います。これは、密な主要ストリームを、到達時刻に応じてその価値が変わる散発的な外部コンテキストと融合しなければならない、第一級のマルチモーダル学習の設定です。構造的な同期待ちを前提とする標準的なマルチモーダル・ベンチマークとは異なり、この設定では、モデルが鮮度(freshness)と信頼性(trust)について明示的に推論する必要があります。本研究では、連続的な市場状態と遅延したウェブ・インテリジェンスを組み合わせたイベント条件付きのケースに焦点を当てます。そして、このより広い問題に対するタイムスタンプ付きの高ノイズなストレステストとして、高頻度の暗号通貨市場のみを用います。我々はCGCMA(Conditionally-Gated Cross-Modal Attention:条件付きゲート付きクロスモーダル注意)を提案します。その中心となる設計原理は、テキストに条件付けされたグラウンディングと、遅れを考慮した信頼制御を分離することです。まずテキストは、価格系列に対して注意を向けることで、イベントに関連する市場状態を特定します。その後、条件付きゲートが、モダリティの一致、ウェブ特徴、ならびに遅延 \tau_{\mathrm{lag}} を用いて、残差注入を調整し、外部コンテキストが陳腐化している、または矛盾している場合には、単一モーダル予測へフォールバックします。さらに、CMI(Crypto Market Intelligence)を導入します。これは、27,914件の実ニュース・サンプルからなる非同期評価コーパスであり、高頻度の価格系列と、遅延したウェブ・インテリジェンスを対応付けます。現在の短い実ニュース・コーパスにおいて、CGCMAは、ニュース利用可能なバー上で、ニュース入手がゼロコストという共通の閾値トレーディング評価の下で、評価されたベースラインの中で最も高い平均下流シャープレシオ(+0.449 \pm 0.257)を達成します。追加の制御実験から、得られた利益はウェブのスカラーだけでは説明できず、単純な鮮度ヒューリスティックでは回復できないことが示されます。以上の証拠は、問題設定の妥当性を裏付け、このストレステスト環境における有望な非同期マルチモーダルな利得を支持するものです。
CGCMA:イベント条件付き非同期フュージョンのための条件付きゲート付きクロスモーダル注意
arXiv cs.LG / 2026/4/21
📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsModels & Research
要点
- この論文は、連続的な一次信号に対して、到着時刻に応じて価値が変わる遅延外部コンテキストを融合する「非同期マルチモーダル学習」を扱う。
- 提案手法CGCMA(Conditionally-Gated Cross-Modal Attention)は、まずテキストの注意でイベントに関連する市場状態を特定し、その後ラグ(遅延)を考慮したゲーティングで、Web文脈が古い・矛盾するときは残差のクロスモーダル注入を抑制する(または単一モダリティ予測へフォールバックする)。
- 著者らはCMI(Crypto Market Intelligence)という非同期評価用データセットを構築し、高頻度の暗号資産価格系列と、遅延させたWeb上のニュース知能を27,914件の実データでペアリングしている。
- 短い実ニュース評価セットでは、共有された「ゼロコストの閾値トレーディング」プロトコルのもとで、CGCMAが平均の下流Sharpe比(+0.449 ± 0.257)で評価基準の中で最良の結果を示した。
- 全体として、非同期なクロスモーダル融合が成立する課題であり、このストレステスト設定でCGCMAが有望な改善をもたらすことを裏付ける証拠が示されている。




