GravCal: 単一画像による IMU 重力事前値のキャリブレーションとサンプルごとの信頼度

arXiv cs.CV / 2026/3/23

📰 ニュースModels & Research

共有:

要点

GravCalは、IMUから得られるノイズのある重力事前値を、単一のRGB画像を用いて再キャリブレーションし、補正後の重力方向とサンプルごとの信頼度を出力するフィードフォワード型モデルである。
入力事前値の残差補正と、事前値に依存しない画像推定を、学習済みゲートによって適応的に両者を重み付けして融合する。
実験では、GravCalは、22.02度（正規化されていないIMU事前値）から14.24度へ平均角度誤差を低減し、事前値が著しく破損している場合には、より大きな改善が見られた。
本研究では、VIO由来の重力真値と Mahony フィルター由来の事前情報を含む、多様なシーンと姿勢にわたる14.8万フレームを超えるデータセットを紹介し、学習済みゲートが事前値の品質と相関し、下流システムにとって有用な信頼度信号となることを示している。

要旨: 重力推定は視覚-慣性認識、拡張現実、ロボティクスの基本となる重要な課題ですが、IMUからの重力事前情報は直線加速度、振動、過渡的な運動の下でしばしば信頼性に欠けます。従来の手法は多くの場合、画像から直接重力を推定するか、比較的正確な慣性入力を想定しており、単一の画像から得られるノイズの多い重力事前情報を修正する現実的な問題はほとんど対処されていません。
本研究では GravCal を提示します。単一画像の重力事前情報の較正のためのフィードフォワードモデルです。1枚のRGB画像とノイズのある重力事前情報を与えると、GravCal は修正後の重力方向とサンプルごとの信頼度スコアを予測します。モデルは入力事前情報の残差補正と事前情報に依存しない画像推定という2つの補完的な予測を組み合わせ、学習済みゲートを用いてそれらを適応的に融合します。
広範な実験により、生の慣性事前情報に対して顕著な改善を示します：GravCal は平均角度誤差を22.02°（IMU事前情報）から14.24°へ低減し、事前情報がひどく破損している場合にはより大きな改善が見られます。さらに、多様なシーンと任意のカメラ姿勢にわたる、VIO由来の基準重力とMahonyフィルタIMU事前情報のペアを含む、148,000フレーム超の新規データセットを導入します。学習済みゲートは事前情報の品質とも相関し、下流システムにとって有用な信頼度信号となります。