勾配からリカッチ幾何学へ：単一パス学習のためのカルマン世界モデル

arXiv cs.LG / 2026/3/17

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

本論文はカルマン世界モデル（KWM）を紹介する。これはバックプロパゲーションの代わりに再帰的ベイズ推定を介して状態空間モデルを訓練する勾配フリーのフレームワークである。
パラメータ学習をカルマン型ゲイン適応に置き換え、訓練をオンラインフィルタリングへと転換し、誤差信号をイノベーションとして機能させる。
この手法は、内部アクティベーションを潜在ダイナミカル状態として扱い、イノベーション項によって補正することで、勾配フリーの訓練と適応を行う、トランスフォーマーベースの大規模言語モデル（LLMs）へと拡張される。
著者らは安定性条件を導出し、計算複雑性を分析し、シーケンスモデリングにおける経験的結果を報告して、頑健性と継続的適応の向上を伴う競争力のある性能を示す。
本研究は、逐次モデルの従来の勾配ベース学習に対する制御理論に基づく代替手段を提示し、オンライン学習およびモデルのロバスト性に潜在的な影響をもたらす可能性がある。

要旨: バックプロパゲーションは現代の機械学習を支配しているが、ダイナミカルシステムを最適化するための唯一の原理的手法ではない。我々は Kalman World Models (KWM) を提案する。これは逆モードの自動微分ではなく、再帰的ベイズフィルタリングによって訓練される学習済み状態空間モデルのクラスである。勾配降下更新の代わりに、パラメータ学習をカルマン型ゲイン適応に置換する。訓練はオンラインフィルタリングとなり、誤差信号はイノベーションになる。さらにこのフレームワークをトランスフォーマーベースの大規模言語モデル（LLMs）へ拡張し、内部活性化を潜在的ダイナミカル状態として扱い、イノベーション項で補正する。これにより、制御理論に基づく勾配フリーの訓練と適応のパラダイムが得られる。安定性条件を導出し、計算量の複雑性を分析し、シリーズモデリングタスクにおける実証的な結果を提供する。これらは改良された頑健性と継続的適応特性を備えた競争力のある性能を示している。

Day 10: 230回の奮闘セッション、結局は一人の人間が文書を読むことに尽きる

Dev.to

本番環境で壊れる、バイラルなAIコーディングデモの背後に潜む5つの危険な嘘

Dev.to

二つのボット、混乱したサーバー: NimbusがAIエージェントのアイデンティティについて明らかにしたこと

Dev.to

OpenTelemetryがLLMトレーシングを標準化しました。コード上では実際にはこのようになっています。

Dev.to

PIXIU: 金融分野向けの大規模言語モデル、指示データ、および評価ベンチマーク

Dev.to

勾配からリカッチ幾何学へ：単一パス学習のためのカルマン世界モデル

要点

関連記事

Day 10: 230回の奮闘セッション、結局は一人の人間が文書を読むことに尽きる

本番環境で壊れる、バイラルなAIコーディングデモの背後に潜む5つの危険な嘘

二つのボット、混乱したサーバー: NimbusがAIエージェントのアイデンティティについて明らかにしたこと

OpenTelemetryがLLMトレーシングを標準化しました。コード上では実際にはこのようになっています。

PIXIU: 金融分野向けの大規模言語モデル、指示データ、および評価ベンチマーク

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer