AI Navigate

RASLF: ライトフィールド超解像のための表現認識型状態空間モデル

arXiv cs.CV / 2026/3/18

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • RASLFは、表現認識型状態空間フレームワークを導入し、表現間の相関を活用してテクスチャの忠実度とビューの一貫性を向上させるライトフィールド超解像の手法です。
  • パノラマエピポーラ表現を用いて多視点の視差差分を明示的にエンコードし、異なるLF表現間の統合を可能にする Progressive Geometric Refinement (PGR) ブロックを特徴とします。
  • Representation Aware Asymmetric Scanning (RAAS) 機構を提案します。各表現空間の特性に基づいて走査パスを動的に調整し、パス剪定を用いて性能と効率のバランスを取ります。
  • Dual-Anchor Aggregation (DAA) モジュールを含み、階層的特徴フローを改善し、冗長な深層特徴を削減して主要な再構成情報を優先します。実験により、最先端の精度と効率を示しています。

Abstract

現在のSSMベースのライトフィールド超解像(LFSR)手法は、さまざまなLF表現間の補完性を十分に活用できず、視点間で微細な質感と幾何学的な不整合を招くことが多い。これらの問題に対処するため、RASLFを提案する。これは、複数のLF表現間の構造的相関を明示的にモデル化する、表現認識型状態空間フレームワークである。具体的には、パノラマエピポーラ表現を用いて多視点の視差差を明示的に符号化し、異なるLF表現間の統合を可能にする Progressive Geometric Refinement (PGR) ブロックを作成する。さらに、Representation Aware Asymmetric Scanning (RAAS) 機構を導入し、異なる表現空間の物理的特性に基づいてスキャンパスを動的に調整し、パス剪定を通じて性能と効率のバランスを最適化する。加えて、Dual-Anchor Aggregation (DAA) モジュールは階層的な特徴フローを改善し、冗長な深層特徴を削減するとともに、重要な再構成情報を優先する。さまざまな公開ベンチマークでの実験により、RASLFは最高の再構成精度を達成しつつ、計算効率も高い水準を維持する。