TokenGS:学習可能なトークンによって3Dガウス予測をピクセルから切り離す
arXiv cs.CV / 2026/4/17
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- TokenGSは、フィードフォワード型3Dガウススプラッティング予測において、カメラ光線に沿った深度の回帰ではなく、3Dガウスの平均座標を直接回帰することで設計上の改善を提案しています。
- 学習可能なガウストークンを用いるエンコーダ・デコーダ構成により、予測される3Dプリミティブの数を入力画像の解像度や参照ビュー数から切り離すことを可能にします。
- 自己教師ありのレンダリング損失のみで学習することで、従来の不適切な前提に依存せずに表現を学ぶことを狙っています。
- 実験では、ポーズノイズやマルチビューの不整合に対する頑健性が向上し、静的・動的の両方のシーンでフィードフォワード再構成の最先端性能を達成したと報告されています。
- TokenGSは、トークン空間での効率的なテスト時最適化を可能にし、静的・動的分解やシーンドフローといった高次の属性の回復にも有利に働くとされています。



