Flow4DGS-SLAM：光フロー誘導型4DガウススパッタリングSLAM

arXiv cs.CV / 2026/4/27

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、動的環境でのSLAMにおいて光フローを用いて4Dガウススパッタリングによる再構成を導く枠組み「Flow4DGS-SLAM」を提案する。
光フローをカメラのエゴモーションモデルにより分解して、カテゴリ非依存のモーションマスクを生成し、動的ガウスと静的ガウスを分離すると同時に、光フローに基づくカメラ姿勢の初期化も行う。
動的3Dガウススパッタリングの学習効率を高めるために、キーフレームで時間的な中心（temporal centers）を明示的にモデル化し、3Dシーングフローの事前情報で伝播させ、適応的な挿入戦略で動的の初期化を行う。
時間的な不透明度と回転をGaussian Mixture Model（GMM）でモデル化して複雑な運動ダイナミクスを適応的に学習し、追跡・動的再構成・学習速度の各面で最先端性能を示す。

概要: 動的な環境の取り扱いは、ビジュアル同時ローカライゼーション・アンド・マッピング（Visual SLAM）の重要な研究課題です。近年の研究では、3Dガウシアン・スプラッティング（3DGS）とSLAMを組み合わせることで、頑健なカメラ姿勢推定とフォトリアルなレンダリングの両立を目指しています。しかし、SLAMを用いて静的領域と動的領域の両方を効率よく再構成することは依然として困難です。本研究では、オプティカルフローに導かれた動的3DGS SLAMのための効率的なフレームワークを提案します。入力深度と事前のオプティカルフローを用いて、まず、カメラの自己運動（ego-motion）モデルをフィットすることでオプティカルフローを分解し、カテゴリ非依存のモーションマスク生成戦略を提案します。このモジュールは動的ガウシアンと静的ガウシアンを分離し、同時にフローに導かれたカメラ姿勢の初期化を提供します。さらに、キーフレームにおいてそれらの時間的中心を明示的にモデル化することで、動的3DGSの学習速度を向上させます。これらの中心は3Dシーンフローの事前知識を用いて伝播され、適応的な挿入戦略により動的に初期化されます。加えて、時間的な不透明度と回転をガウス混合モデル（GMM）でモデル化することで、複雑なダイナミクスを適応的に学習します。実験結果は、追跡、動的再構成、学習効率において、本手法が最先端の性能を示すことを実証しています。