Fisheye3R:フィッシュアイレンズ向けに統一型3Dフィードフォワード基盤モデルを適応させる
arXiv cs.CV / 2026/4/1
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、マルチビュー3D再構成のためのフィードフォワード基盤モデルが、フィッシュアイ画像(広視野)で劣化するのは、非線形なフィッシュアイ投影によって画素の空間的位置が変化し、視点(パースペクティブ)で訓練されたモデルが見たことのない形の変換が生じるためだと主張している。
- 既存のマルチビュー3D再構成基盤モデルを、フィッシュアイ入力をネイティブに扱えるように拡張しつつ、パースペクティブ画像での後退(回帰)を回避する適応フレームワーク「Fisheye3R」を提案する。
- フィッシュアイデータが限られ、教師ありの正解(グラウンドトゥルース)監督も乏しいという課題に対し、著者らはラベルなしのパースペクティブ画像のみを用いた自己教師ありの適応を可能にする柔軟な学習戦略を導入している。
- さらに、フィッシュアイの学習データを不要にしつつ、フィッシュアイ性能を向上できる教師あり適応モードも示している。
- 3つの基盤モデル(VGGT、π^3、MapAnything)に対する実験では、フィッシュアイ画像において、カメラ姿勢、深度、ポイントマップ、視野推定の各指標で一貫した改善が得られたことが示されている。



