GenMatter:生成的マテリアルモデルによる物体の知覚
arXiv cs.AI / 2026/4/27
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- この論文は、「GenMatter」として、運動の手がかりと外観特徴を統合的に扱うことで物理的な物体を知覚するための生成モデルを提案します。
- シーンを階層的に表現し、まず粒子(局所マテリアルを表す小さなガウス)として低レベルの手がかりをまとめ、次に粒子を、まとまりをもって独立に動く物理的実体に対応するクラスタへと集約します。
- 並列化したブロックGibbsサンプリングに基づくハードウェア加速推論手法を開発し、粒子の安定した運動とクラスタリングを復元します。
- 評価は3つの領域(2Dのランダムドット・キネマティクス、カモフラージュされた回転物体、自然画像風RGB動画)で行われ、人のような物体知覚、運動からの3D構造復元、変形物体の物体レベル追跡と理解の頑健性が示されます。
- 本研究は、人間の視覚原理に基づく運動ベース知覚を強調し、多様な入力条件で既存のコンピュータビジョンが苦手とする部分を埋めることを目指しています。




