カルマンフィルタリングのオンライン学習：出力から状態推定へ

arXiv cs.LG / 2026/3/31

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、部分的に観測された線形動的システムにおいて、基となるシステムモデルが未知である場合のカルマンフィルタリングのオンライン学習を研究する。
出力推定と状態推定の双方に対応可能な、統一的なオンライン最適化フレームワークを提案する。
出力推定では、推定誤差コストの性質（条件付き強凸性を含む）を用いて、時間範囲 T にわたる \\log T のレグレット上界を証明する。
状態推定では、まず全アクセスの仮定の下では、T に対して準線形のレグレットを達成できるアルゴリズムは存在しないことを示す不可能性結果を確立し、その後、より情報量の多い測定を用いるランダムなクエリ手法のもとで \\sqrt{T} レグレットが達成可能になることを示す。
数値実験によりアルゴリズムを検証し、限られた観測のもとで「状態クエリの回数」と「達成可能なレグレット」の間のトレードオフを具体的に示す。

要旨: 本論文では、部分的に観測される線形動的システムにおいて、システムモデルが未知なカルマンフィルタリングを学習する問題を扱います。提案するのは、オンライン最適化に基づく統一的なアルゴリズム枠組みであり、出力推定と状態推定の両方のシナリオを解くために利用できます。条件付き強凸性などの推定誤差コスト関数の性質を調べることで、出力推定シナリオにおいて、本アルゴリズムが地平線長 $T$ に対して $\log T$ -レグレットを達成することを示します。さらに重要なのは、文献における未解決問題である、状態推定のためのカルマンフィルタリングを学習するというより難しいシナリオに取り組む点です。まず、問題の基本的な制約を特徴付け、任意のアルゴリズムが $T$ に関して劣線形（sublinear）のレグレットを達成することが不可能であることを示します。さらに、アルゴリズムにランダムなクエリ（問い合わせ）方式を導入することで、実際にシステム状態のより情報量の多い測定への問い合わせアクセスをアルゴリズムが制限される場合に、 $\sqrt{T}$ -レグレットが達成可能であることを示します。本アルゴリズムとレグレットは、達成されるレグレットとクエリ数の間のトレードオフを素直に捉えており、観測が限られたオンライン学習問題に光を当てます。数値例により、提案アルゴリズムの性能を検証します。

5分の指示で「5時間働く」TANRENのAIエージェント、労働時間の常識激変

日経XTECH

[D] 分散型プルーフ・オブ・ワーク計算は、ニューラルネットワーク学習のための協調（コーディネーション）要件をどのように扱うのか？

Reddit r/MachineLearning

BYOKは単なる料金モデルではない：AIプロダクトの信頼を変える理由

Dev.to

AIによる引用レジストリと、記録間におけるアイデンティティの持続性

Dev.to

Google Gemini 3.1 Flash Live と VideoSDK でリアルタイムAIボイスエージェントを構築する

Dev.to

カルマンフィルタリングのオンライン学習：出力から状態推定へ

要点

関連記事

5分の指示で「5時間働く」TANRENのAIエージェント、労働時間の常識激変

[D] 分散型プルーフ・オブ・ワーク計算は、ニューラルネットワーク学習のための協調（コーディネーション）要件をどのように扱うのか？

BYOKは単なる料金モデルではない：AIプロダクトの信頼を変える理由

AIによる引用レジストリと、記録間におけるアイデンティティの持続性

Google Gemini 3.1 Flash Live と VideoSDK でリアルタイムAIボイスエージェントを構築する

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer