広告

カルマンフィルタリングのオンライン学習:出力から状態推定へ

arXiv cs.LG / 2026/3/31

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、部分的に観測された線形動的システムにおいて、基となるシステムモデルが未知である場合のカルマンフィルタリングのオンライン学習を研究する。
  • 出力推定と状態推定の双方に対応可能な、統一的なオンライン最適化フレームワークを提案する。
  • 出力推定では、推定誤差コストの性質(条件付き強凸性を含む)を用いて、時間範囲 T にわたる \\log T のレグレット上界を証明する。
  • 状態推定では、まず全アクセスの仮定の下では、T に対して準線形のレグレットを達成できるアルゴリズムは存在しないことを示す不可能性結果を確立し、その後、より情報量の多い測定を用いるランダムなクエリ手法のもとで \\sqrt{T} レグレットが達成可能になることを示す。
  • 数値実験によりアルゴリズムを検証し、限られた観測のもとで「状態クエリの回数」と「達成可能なレグレット」の間のトレードオフを具体的に示す。

要旨: 本論文では、部分的に観測される線形動的システムにおいて、システムモデルが未知なカルマンフィルタリングを学習する問題を扱います。提案するのは、オンライン最適化に基づく統一的なアルゴリズム枠組みであり、出力推定と状態推定の両方のシナリオを解くために利用できます。条件付き強凸性などの推定誤差コスト関数の性質を調べることで、出力推定シナリオにおいて、本アルゴリズムが地平線長 T に対して
\log T
-レグレットを達成することを示します。さらに重要なのは、文献における未解決問題である、状態推定のためのカルマンフィルタリングを学習するというより難しいシナリオに取り組む点です。まず、問題の基本的な制約を特徴付け、任意のアルゴリズムが T に関して劣線形(sublinear)のレグレットを達成することが不可能であることを示します。さらに、アルゴリズムにランダムなクエリ(問い合わせ)方式を導入することで、実際にシステム状態のより情報量の多い測定への問い合わせアクセスをアルゴリズムが制限される場合に、
\sqrt{T}
-レグレットが達成可能であることを示します。本アルゴリズムとレグレットは、達成されるレグレットとクエリ数の間のトレードオフを素直に捉えており、観測が限られたオンライン学習問題に光を当てます。数値例により、提案アルゴリズムの性能を検証します。

広告