要旨:産業用金融システムは、取引、ユーザー行動、システムログといった時系列イベントの連なりに基づいて機能します。近年の研究が表現学習と大規模言語モデルを強調する一方で、生産システムは解釈性、限られた監視下での頑健性、そして厳格な遅延制約のため、手作業で作成された統計的特徴量に強く依存し続けています。これにより、学習済み埋め込みと特徴量ベースのパイプラインの間にはなおも乖離が生じています。Embedding-Aware Feature Discovery (EAFD) を導入します。これは事前学習済みのイベント列埋め込みと自己反省的なLLM駆動の特徴生成エージェントを結合することでこのギャップを橋渡しする統一フレームワークです。EAFD は、生のイベント列から直接特徴を反復的に発見・評価・洗練させるために、2つの補完的基準を用います:\emph{整合性}(埋め込みにすでにエンコードされている情報を説明するもの)と \emph{補完性}(それらに欠けている予測信号を特定するもの)。オープンソースと産業界の取引ベンチマークの両方において、EAFD は埋め込みのみおよび特徴ベースのベースラインを一貫して上回り、最先端の事前学習済み埋め込みを最大で +5.8\% 上回る相対的利得を達成し、イベント列データセット全体で新たな最先端の性能を実現します。
埋め込み対応型の特徴発見: イベント系列における潜在表現と解釈可能な特徴を橋渡しする
arXiv cs.LG / 2026/3/18
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- Embedding-Aware Feature Discovery (EAFD) は、事前学習済みのイベント系列埋め込みと自己反省的な LLM 主導の特徴生成エージェントを結びつけ、イベント系列における潜在表現と解釈可能な特徴を橋渡しする枠組みを導入する。
- それは、整合性と補完性の二つの基準を用いて、生のイベント系列から直接特徴を反復的に発見・評価・精練する。
- オープンソースと産業界の取引ベンチマークにまたがり、EAFD は埋め込みのみのベースラインおよび特徴ベースのベースラインを上回り、相対的に最大で5.8%の改善を達成し、イベント系列データセットで新たな最先端の成果を樹立した。
- このアプローチは、解釈性やレイテンシといった本番システムのニーズに対処し、学習済み埋め込みを従来の特徴パイプラインと金融分野で統合する実践的な道筋を提案する。
