概要: 軌跡(トラジェクトリ)の異常検知は、不正検知から都市のモビリティ分析まで、幅広いアプリケーションの基盤となっています。高密度GPS手法は、異常速度や短時間の出来事といった細かな証拠を保持しますが、その二次コストのために、数か月規模の解析は困難です。その結果、既存の手法では高密度GPSの軌跡に対して複数か月にわたる期間の異常を検知できていません。現在の分野では代わりに、証拠を捨て去るスケーラブルな疎(スパース)滞在点(stay-point)手法に依存しており、そのために各状況(レジーム)ごとに別々のアーキテクチャを強いられ、知識の移転が妨げられています。私たちは、このボトルネックは不要であると主張します。人の軌跡は、高密度でも疎でも、日内(within-day)と日跨ぎ(across-day)の軸に沿った自然な二次元の周期構造を共有しています。そこで本研究では、軌跡異常検知を視覚問題として再定式化する TITAnD(Trajectory Image Transformer for Anomaly Detection)を提案します。具体的には、軌跡をハイパースペクトル軌跡画像(Hyperspectral Trajectory Image: HTI)として表現します。HTI は「日」×「時刻(日内の時刻)」のグリッドであり、そのチャネルは、いずれかのモダリティから得られる空間・セマンティック・時間・運動(キネマティクス)情報を符号化します。これにより両者を単一の表現として統一します。この定式化のもとでは、エージェント単位の検知は画像分類に、時間的な局在化はセマンティックセグメンテーションに帰着します。この表現をモデル化するために、Cyclic Factorized Transformer(CFT)を導入します。CFT は、注意(アテンション)を2つの時間軸に沿って分解し、人間のルーティンが持つ周期的な帰納的バイアスを符号化しつつ、注意計算コストを桁(orders of magnitude)単位で削減します。これにより、初めて高密度の複数か月にわたる異常検知が可能になります。実験的に、TITAnD は疎・高密度の両方のベンチマークで最良の AUC-PR を達成し、UNet のような視覚モデルを上回ります。さらに、同等のメモリを用いた Transformer と比べて 11〜75 倍高速であることを示し、視覚としての再定式化と構造を意識したモデリングが、両方とも同時に不可欠であることを裏付けます。コードは近日公開予定です。
多か月軌跡異常検出のためのハイパースペクトル軌跡画像
arXiv cs.CV / 2026/3/27
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 実験の結果、TITAnDは疎なベンチマークおよび密なベンチマークの両方で最良のAUC-PRを達成し、UNetなどの視覚ベースラインを上回ることが示された。さらに、同等のTransformerモデルに比べて11〜75倍高速であり、近いうちに公開コードのリリースが予定されている。



