波形の文法: ニューロ-シンボリックVLMエージェントによる説明可能な多変量時系列イベント検出へ
arXiv cs.LG / 2026/3/13
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、Knowledge-Guided TSED(知識指向の時系列イベント検出)を提案します。ここで、モデルは自然言語のイベント記述を、ほとんどまたは全くラベル付きデータを要さずに多変量信号の区間へ対応づけなければなりません。
- ELT(Event Logic Tree)を提案します。ELT は、イベントの内在する時間論理構造をモデル化することを通じて、言語的記述と時系列データを結びつける新しい知識表現フレームワークです。
- ELT に基づき、信号の視覚化からプリミティブを反復的に実例化し、それらを ELT 制約の下で組み合わせるニューロ-シンボリック VLM エージェント・フレームワークを提示します。これにより、検出された区間と実例化された木の形で忠実な説明を生成します。
- 実世界の時系列データに基づく専門家知識とアノテーションを含むベンチマークを公開します。実験と人間の評価は、教師ありファインチューニングのベースラインおよび既存のLLMs/VLMsに基づくゼロショット時系列推論フレームワークと比較して、提案手法が優れていることを示します。ELT が VLM の固有の幻視を緩和する上で重要であることも示します。
概要: 時系列イベント検出(TSED)は、長い間、多くの高リスク領域で重要な課題であり続けてきました。統計的異常とは異なり、イベントは意味論によって定義され、複雑な内部構造を持ちます。現実世界のデータでラベル付きデータが乏しい状況下で、誘導的に学習することは困難です。この点を踏まえ、Knowledge-Guided TSED を導入します。ここでは、モデルに自然言語のイベント記述が与えられ、訓練データがほとんどない、あるいは全くない状態で、それを多変量信号の区間へ grounding する必要があります。これに取り組むため、イベントの内在する時間論理構造をモデル化することで、言語的記述と物理的な時系列データを橋渡しする新しい知識表現フレームワークとして、ELT(Event Logic Tree)を導入します。ELT に基づき、信号の視覚化からプリミティブを反復的に実例化し、それらを ELT 制約の下で組み合わせるニューロ-シンボリック VLM エージェント・フレームワークを提示します。これにより、検出された区間と実例化された木の形として忠実な説明の両方を生成します。私たちのアプローチの有効性を検証するため、専門家の知識とアノテーションを含む実世界の時系列データに基づくベンチマークを公開します。実験と人間の評価は、教師ありのファインチューニングのベースラインおよび既存のゼロショット時系列推論フレームワーク(LLMs/VLMs に基づく)より私たちの手法が優れていることを示しています。さらに、ELT が、信号の形状とイベント意味論のマッチングにおける VLM の固有のハルシネーションを緩和するうえで重要であることも示しています。